スプートニク日本
現時点のヤンデックスのオンライン翻訳サービスの言語は94言語で、ロシアの地方言語のタタール語とバシキール語が含まれ、すでにグーグル翻訳を越えた。
先にヤンデックスの開発者たちは、カリブ海の島々の住民30万人超が話すパピアメント語の課題を解決することに成功した。この経験が、開発者たちをロシアの少数民族の言語翻訳プロジェクトに駆り立てたという。
ヤンデックスは年内にも自動翻訳システムにロシアのコミ共和国とペルミ地方で話されているコミ語を加える計画。
ヤンデックスの代表者は「スプートニク」に、希少言語の自動翻訳を実現するために必要なことについて、次のように語ったー
「自動翻訳システムに新しい言語を教えるためにはデータが必要だ。自動翻訳システムには2言語の用例対訳が取り込まれ、コートパスが十分に大きい状態で自動翻訳プログラムが翻訳を習得する。希少言語の場合は、用例対訳が少ないという事実に直面する。自動翻訳システムは、我々がパピアメント語の時に行ったように、親戚関係にある言語を通じて希少言語を学ぶのを試みることができるが、もちろん、それぞれのケースで課題を検討する必要がある」。
ヤンデックスが開発したテキスト翻訳のアルゴリズムは、作家のジョン・トールキン氏がつくった「エルフ語」を含む、事実上あらゆる言語の翻訳を可能とする。
先の報道によると、ハッカー集団「OurMine 」が、有名ブロガー含むユーチューブのアカウント数千個をハッキング。