Собранные здесь ссылки на ресурсы ни в коем случае не должны рассматриваться как некий исчерпывающий обзор по затрагиваемым темам. Ссылки собираются по мере решения вполне конкретных задач в рамках проекта по созданию поискового движка (например - ресурсы по китайскому и японскому языкам), поэтому некоторые полезные ресурсы могли быть пропущены. Кроме того, в связи с технической направленностью проекта сюда попадали преимущественно ссылки на ресурсы, которые полезны скорее программистам, нежели гуманитариям.
Я продолжаю искать ссылки на ресурсы Сети и электронные документы, посвященные языкам народов России. К сожалению, в силу отсутствия коммерческой заинтересованности авторов в Интернете научных ресурсов, посвященных языкам малых народов России, практически нет (достаточно сравнить с засильем ресурсов, посвященным английскому языку). Мой интерес к языкам народов России тоже является некоммерческим. Определенная часть программного обеспечения, разработанного в рамках проекта, может быть использована для некоторых исследований текстов на естественных языках (см. например описание программы empir), и мне хотелось бы получить результаты не только для "мэйнстримовых языков" - русского, английского, других европейских, но и для малоизвестных.
Надеюсь со временем собрать некоторый материал для обработки по нашим братским языкам - татарскому, например (напомню французскую пословицу "поскреби русского и увидишь татарина"). Конечно, под братскими языками я подразумеваю не лингвистическое родство, а историческое.
В процессе разработки поисковой машины постоянно возникали вопросы технического плана, связанные с одновременной обработкой текстов на многих языках. Среди возможных решений оптимальным является использование стандарта UNICODE (хотя у него есть малоизвестные альтернативы). При реализации алгоритмов мы старались придерживаться стандарта, в частности за счет использования сторонних open-source библиотек и официальных материалов с сайта консорциума разработки Unicode. Вы можете посмотреть на результаты этой работы - скриншоты поисковой системы при работе с текстами на разных языках, а также увидеть примеры использования юникода в запросах.
www.unicode.org - всевозможные таблицы по представлению символов в стандарте UNICODE
www.unicode.org/onlinedat/resources.html - полезные ссылки по программным библиотекам для поддержки UNICODE
en.wikipedia.org/wiki/ISO_8859 - Описание стандарта iso 8859 - кодовые страницы - в Википедии
www.i18nguy.com/unicode/codepages.html#msftwindows - много информации для программистов по Юникоду
www.suncloud.ru/workshop/wdhplus/encoding/encoding2.htm#unicode - неплохой вводный курс Юникода на русском языке
www.ibm.com/software/globalization/icu/downloads.jsp - open-source библиотека IBM ICU для выполнения i18n программ
Мы разрабатывали архитектуру поисковой машины с прицелом на многоязыковое использование, которая включает в себя не только локализацию пользовательского интерфейса (см. скриншоты поисковой системы Integra), но и возможность одновременного поиска информации в документах, содержащих тексты на разных языках (то есть в том числе использующих разные алфавиты). Обратите внимание, что решение этой задачи непосредственно связано с реализацией юникода, поэтому ссылки на релевантные ресурсы сведены в одну страницу.
slovari.gramota.ru/ - Словари русского языка на сайте Грамота.ru
Общественно-научный проект "Языки русских городов" - возможность "перевода" диалектных слов, употребляемых в разных местностях России.
Корпус русского языка - научный проект, посвященный современному русскому языку (лексика и грамматика).
typo.mania.ru/glossary/ - глоссарий по типографским терминам (в том числе всевозможные названия диактрических символов и т.п.)
http://miresperanto.narod.ru/o_russkom_jazyke.htm - познавательный материал по русскому языку
Статья о французском языке в Википедии
Подборка ссылок на сайте Ильи Франка - там есть книги, словари, грамматика для скачивания
Статья о японском языке в Википедии
www.csse.monash.edu.au/~jwb/japanese.htm - Сайт Джима Брина о японском языке - словари, грамматика и т.д. См. также каталог FTP-архива http://ftp.cc.monash.edu.au/pub/nihongo/00INDEX.html
anime.dvdspecial.ru/Japan/hiragana.shtml - О японской слоговой азбуке "хирагана"
www.sensi.org/~alec/lang/japan/encoding.html - Сетевые кодировки японского языка (рус)
lfw.org/text/jp.html - Japanese text encoding (eng)
www.popjisyo.com/WebHint/Portal_e.aspx - online-переводчик для японских (и китайских) веб-сайтов
www.omniglot.com/writing/chinese.htm - китайское письмо (англ)
Статья о китайском языке в Википедии
www.papahuhu.com/lessons - Папа ХуХу - сайт о китайском языке (на русском)
chinesecomputing.com.hosting.domaindirect.com/ - обработка текста на китайском языке (для программистов)
home.att.net/~jameskass/chiradtest.htm - китайские радикалы (таблица в utf8)
www.mandarintools.com/ - online Chinese tools (включая перевод между китайским и английским)
www.popdict.com/rdict_chinese.htm - словари для скачивания
www.chinalanguage.com/ - информация по языку
members.tripod.com/ggdavid/georgia/language/index.htm
www.belarus-misc.org/bel-ling.htm#ling
www.franklang.ru/idisch.html - подборка ссылок на ресурсы по идиш (включая словари для скачивания) на сайте Илья Франка
www.omniglot.com/writing/arabic.htm - арабский язык
www.omniglot.com/writing/greek.htm - базовая информация о греческом языке (англ)
http://miresperanto.narod.ru/pri_angla.htm - познавательные материалы
http://www.henkimaa.nu/finndex/suomea/learning/grammar.html - грамматика языка и ссылки на ресурсы (на англ.)
ispell-fi.sourceforge.net/ ispell-fi: finnish spell checking dictionary for ispell
stardict.sourceforge.net/ - StarDict - cross-platform and international dictionary written in Gtk2
www.helsinki.fi/~hkantola/dict.html - бесплатные словари online и для скачивания
sourceforge.net/projects/xdxf/ - проект XML Dictionary Exchange Format. Есть много словарей для скачивания.
Статьи о тайском языке и тайском алфавите в Википедии
www.trigeminal.com/samples/provincial.html - "Почему они просто не говорят по-английски?" - примеры перевода на многие языки
www.columbia.edu/kermit/utf8.html - примеры перевода фразы на многие языки
crism.maden.org/dunno.html - еще примеры перевода фразы на многие языки
home.freeuk.net/cadenza/chunky-monkey/ - "Chunky monkey had a cow" на разных языках
www.omniglot.com/babel/ - перевод истории о вавилонской башне на разные языки
salrc.uchicago.edu/resources/fonts/main.html - South Asia languages resource centre
www.franklang.ru/f.html - на сайте проекта Ильи Франка можно найти море информации по многим языкам
www.freelang.net/dictionary/index.html - программа-переводчик (free) и словари для скачивания
http://www.lingvisto.org - языковая энциклопедия "Лингвисто" краткая информация о разных языках
http://en.wikipedia.org/w/index.php?title=Latin_alphabet&oldid=27131663 - о латинском алфавите и его модификациях в Википедии
http://miresperanto.narod.ru - много познавательной информации по английскому, русскому, эсперанто и другим искусственным языкам
http://wikisource.org/wiki/Main_Page - Викитека - свободная библиотека с текстами на разных языках
Искать, найти, затем — связаться! - языки для общения с другими цивилизациями (Журнал "Знание-Сила")
http://www.ling.yale.edu/~elf - фонд исчезающих языков
http://cbook.ru/peoples/class/lingv1.shtml - лингвистическая классификация народов
http://www.eki.ee/books/redbook/ - красная книга народов России (англ)
http://www.smo.uhi.ac.uk/saoghal/mion-chanain/en/ - языки малых народов Европы
Предложения по добавлению ссылок в каталог - шлите электропочтой.
Также с удовольствием пообщаемся в нашем форуме
последние изменения 10.08.2007
© Mental Computing 2010