IcuCollation: Update comments on $tailoringFirstLetters

A few more languages marked as "Verified by native speakers",
based on which collations we've been using in production
on Wikimedia wikis.

(I'm not sure if this makes sense now that we're fairly confident
that these are good in general, but since it's already here...)

Change-Id: I8e1f31fa61509eca8c76a2df4e18638005e68b77
This commit is contained in:
Bartosz Dziewoński 2016-09-21 21:24:41 +02:00
parent 2e90f89aa9
commit cf13e01f38

View file

@ -94,10 +94,12 @@ class IcuCollation extends Collation {
// Verified by native speakers
'be' => [ "Ё" ],
'be-tarask' => [ "Ё" ],
'bs' => [ "Č", "Ć", "", "Đ", "Lj", "Nj", "Š", "Ž" ],
'cs' => [ "Č", "Ch", "Ř", "Š", "Ž" ],
'cy' => [ "Ch", "Dd", "Ff", "Ng", "Ll", "Ph", "Rh", "Th" ],
'en' => [],
// RTL, let's put each letter on a new line
'fa' => [
// RTL, let's put each letter on a new line
"آ",
"ء",
"ه",
@ -106,15 +108,27 @@ class IcuCollation extends Collation {
],
'fi' => [ "Å", "Ä", "Ö" ],
'fr' => [],
'hr' => [ "Č", "Ć", "", "Đ", "Lj", "Nj", "Š", "Ž" ],
'hsb' => [ "Č", "", "Ě", "Ch", "Ł", "Ń", "Ř", "Š", "Ć", "Ž" ],
'hu' => [ "Cs", "Dz", "Dzs", "Gy", "Ly", "Ny", "Ö", "Sz", "Ty", "Ü", "Zs" ],
'is' => [ "Á", "Ð", "É", "Í", "Ó", "Ú", "Ý", "Þ", "Æ", "Ö", "Å" ],
'it' => [],
'lt' => [ "Č", "Š", "Ž" ],
'lv' => [ "Č", "Ģ", "Ķ", "Ļ", "Ņ", "Š", "Ž" ],
'mk' => [ "Ѓ", "Ќ" ],
'nl' => [],
'pl' => [ "Ą", "Ć", "Ę", "Ł", "Ń", "Ó", "Ś", "Ź", "Ż" ],
'pt' => [],
'ru' => [],
'sk' => [ "Ä", "Č", "Ch", "Ô", "Š", "Ž" ],
'sr' => [],
'sv' => [ "Å", "Ä", "Ö" ],
'sv@collation=standard' => [ "Å", "Ä", "Ö" ],
'ta' => [
"\xE0\xAE\x82", "", "க்ஷ", "க்", "ங்", "ச்", "ஞ்", "ட்", "ண்", "த்", "ந்",
"ப்", "ம்", "ய்", "ர்", "ல்", "வ்", "ழ்", "ள்", "ற்", "ன்", "ஜ்", "ஶ்", "ஷ்",
"ஸ்", "ஹ்", "க்ஷ்"
],
'uk' => [ "Ґ", "Ь" ],
'vi' => [ "Ă", "Â", "Đ", "Ê", "Ô", "Ơ", "Ư" ],
// Not verified, but likely correct
@ -123,10 +137,8 @@ class IcuCollation extends Collation {
'az' => [ "Ç", "Ə", "Ğ", "İ", "Ö", "Ş", "Ü" ],
'bg' => [],
'br' => [ "Ch", "C'h" ],
'bs' => [ "Č", "Ć", "", "Đ", "Lj", "Nj", "Š", "Ž" ],
'ca' => [],
'co' => [],
'cs' => [ "Č", "Ch", "Ř", "Š", "Ž" ],
'da' => [ "Æ", "Ø", "Å" ],
'de' => [],
'dsb' => [ "Č", "Ć", "", "Ě", "Ch", "Ł", "Ń", "Ŕ", "Š", "Ś", "Ž", "Ź" ],
@ -141,35 +153,23 @@ class IcuCollation extends Collation {
'ga' => [],
'gd' => [],
'gl' => [ "Ch", "Ll", "Ñ" ],
'hr' => [ "Č", "Ć", "", "Đ", "Lj", "Nj", "Š", "Ž" ],
'hsb' => [ "Č", "", "Ě", "Ch", "Ł", "Ń", "Ř", "Š", "Ć", "Ž" ],
'kk' => [ "Ү", "І" ],
'kl' => [ "Æ", "Ø", "Å" ],
'ku' => [ "Ç", "Ê", "Î", "Ş", "Û" ],
'ky' => [ "Ё" ],
'la' => [],
'lb' => [],
'lt' => [ "Č", "Š", "Ž" ],
'mk' => [ "Ѓ", "Ќ" ],
'mo' => [ "Ă", "Â", "Î", "Ş", "Ţ" ],
'mt' => [ "Ċ", "Ġ", "", "Ħ", "Ż" ],
'nl' => [],
'no' => [ "Æ", "Ø", "Å" ],
'oc' => [],
'rm' => [],
'ro' => [ "Ă", "Â", "Î", "Ş", "Ţ" ],
'rup' => [ "Ă", "Â", "Î", "Ľ", "Ń", "Ş", "Ţ" ],
'sco' => [],
'sk' => [ "Ä", "Č", "Ch", "Ô", "Š", "Ž" ],
'sl' => [ "Č", "Š", "Ž" ],
'smn' => [ "Á", "Č", "Đ", "Ŋ", "Š", "Ŧ", "Ž", "Æ", "Ø", "Å", "Ä", "Ö" ],
'sq' => [ "Ç", "Dh", "Ë", "Gj", "Ll", "Nj", "Rr", "Sh", "Th", "Xh", "Zh" ],
'sr' => [],
'ta' => [
"\xE0\xAE\x82", "", "க்ஷ", "க்", "ங்", "ச்", "ஞ்", "ட்", "ண்", "த்", "ந்",
"ப்", "ம்", "ய்", "ர்", "ல்", "வ்", "ழ்", "ள்", "ற்", "ன்", "ஜ்", "ஶ்", "ஷ்",
"ஸ்", "ஹ்", "க்ஷ்"
],
'tk' => [ "Ç", "Ä", "Ž", "Ň", "Ö", "Ş", "Ü", "Ý" ],
'tl' => [ "Ñ", "Ng" ],
'tr' => [ "Ç", "Ğ", "İ", "Ö", "Ş", "Ü" ],