wiki.techinc.nl/tests/phpunit/languages/classes/LanguageCrhTest.php
tjones a0b511319c Crimean Tatar Transliteration
This is a first pass at Latin/Cyrillic translitertion for Crimean
Tatar (crh).

Includes transliteration tables, prefix/suffix mappings, regex
mappings, and exceptions lists for words and abbreviations.

Regularize CRH language name in messages/* files.

Fix "varient" typos in qqq.json.

Add unit tests for CRH transliteration.

Bug: T23582
Change-Id: I424703f99adf837f6217872b882d1ea26bfdd068
2017-11-20 16:56:38 -05:00

72 lines
3.4 KiB
PHP
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<?php
class LanguageCrhTest extends LanguageClassesTestCase {
/**
* @dataProvider provideAutoConvertToAllVariants
* @covers Language::autoConvertToAllVariants
*/
public function testAutoConvertToAllVariants( $result, $value ) {
$this->assertEquals( $result, $this->getLang()->autoConvertToAllVariants( $value ) );
}
public static function provideAutoConvertToAllVariants() {
return [
[ // general words, covering more of the alphabet
[
'crh' => 'рузгярнынъ ruzgârnıñ Париж Parij',
'crh-cyrl' => 'рузгярнынъ рузгярнынъ Париж Париж',
'crh-latn' => 'ruzgârnıñ ruzgârnıñ Parij Parij',
],
'рузгярнынъ ruzgârnıñ Париж Parij'
],
[ // general words, covering more of the alphabet
[
'crh' => 'чёкюч çöküç элифбени elifbeni полициясы politsiyası',
'crh-cyrl' => 'чёкюч чёкюч элифбени элифбени полициясы полициясы',
'crh-latn' => 'çöküç çöküç elifbeni elifbeni politsiyası politsiyası',
],
'чёкюч çöküç элифбени elifbeni полициясы politsiyası'
],
[ // general words, covering more of the alphabet
[
'crh' => 'хусусында hususında акъшамларны aqşamlarnı опькеленюв öpkelenüv',
'crh-cyrl' => 'хусусында хусусында акъшамларны акъшамларны опькеленюв опькеленюв',
'crh-latn' => 'hususında hususında aqşamlarnı aqşamlarnı öpkelenüv öpkelenüv',
],
'хусусында hususında акъшамларны aqşamlarnı опькеленюв öpkelenüv'
],
[ // general words, covering more of the alphabet
[
'crh' => 'кулюмсиреди külümsiredi айтмайджагъым aytmaycağım козьяшсыз közyaşsız',
'crh-cyrl' => 'кулюмсиреди кулюмсиреди айтмайджагъым айтмайджагъым козьяшсыз козьяшсыз',
'crh-latn' => 'külümsiredi külümsiredi aytmaycağım aytmaycağım közyaşsız közyaşsız',
],
'кулюмсиреди külümsiredi айтмайджагъым aytmaycağım козьяшсыз közyaşsız'
],
[ // exception words
[
'crh' => 'инструменталь instrumental гургуль gürgül тюшюнмемек tüşünmemek',
'crh-cyrl' => 'инструменталь инструменталь гургуль гургуль тюшюнмемек тюшюнмемек',
'crh-latn' => 'instrumental instrumental gürgül gürgül tüşünmemek tüşünmemek',
],
'инструменталь instrumental гургуль gürgül тюшюнмемек tüşünmemek'
],
[ // multi part words
[
'crh' => 'эки юз eki yüz',
'crh-cyrl' => 'эки юз эки юз',
'crh-latn' => 'eki yüz eki yüz',
],
'эки юз eki yüz'
],
[ // ALL CAPS, made up acronyms
[
'crh' => 'ÑAB QIC ĞUK COT НЪАБ КЪЫДж ГЪУК ДЖОТ CA ДЖА',
'crh-cyrl' => 'НЪАБ КЪЫДж ГЪУК ДЖОТ НЪАБ КЪЫДж ГЪУК ДЖОТ ДЖА ДЖА',
'crh-latn' => 'ÑAB QIC ĞUK COT ÑAB QIC ĞUK COT CA CA',
],
'ÑAB QIC ĞUK COT НЪАБ КЪЫДж ГЪУК ДЖОТ CA ДЖА'
],
];
}
}