I've been testing alphabetical sorting in Chinese (if I may call it so). This is how Excel sorts some example words:
啊<波<词<的<俄<佛<歌<和<及<课<了<馍<呢<票<气<日<四<特<瓦<喜<以<只
0<2<85<!<@<版本<标记<成员<错误<导出<导航<Excel 文件<访问<分类<更改<规则<HTML<基本<记录<可选<快捷方式<类别<历史记录<密码<目录<内联<内容<讨论<文件<页面<只读
and this is what came out of Collections.sort(list, simplified_chinese_collator_comparator)
(the first offending character in bold):
啊<波<词<的<俄<佛<歌<和<及<课<了<呢<票<气<日<四<特<瓦<喜<以<只<馍
!<@<0<2<85<Excel 文件<HTML<版本<标记<成员<错误<导出<导航<访问<分类<更改<规则<基本<记录 <可选<快捷方式<类别<历史记录<密码<目录<内联<内容<讨论<文件<页面<只读
I don't know anything about Chinese. Does anyone know why Collator
output it's different, or what is it based on?
Are there any other libraries for language-based sorting?