<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Евросоюз финансирует проект открытой системы автоматического...</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html</link>
    <description>Учреждения в Европе тратят около одного миллиарда евро в год на перевод документов c 23 официальных языков Евросоюза. Евросоюз выделил (http://cacm.acm.org/news/67677-multilingual-translation-system-receives-over-2-million-euro-in-eu-funding/fulltext) грант в 2,3 млн. евро на разработку проекта Molto (http://www.molto-project.eu/) по  развитию систем многоязычного автоматического перевода. При успешности данного проекта Евросоюз ожидает в будущих периодах значительное сокращение затрат на переводы.&lt;br&gt;&lt;br&gt;&lt;br&gt;В отличие от службы онлайн-перевода Google, проект Molto (Multi-lingual Online Translation) имеет своей целью сделать перевод настолько точным, насколько это возможно. Внимание уделяется точности, а не полноте перевода. Целевыми клиентами являются компании и учреждения, которые рассчитывают на правильно переведенную информацию с веб-сайтов и других документальных источников, а не на информацию, получаемую от конечных пользователей и потребителей. Разработчики используют структуру специал...&lt;br&gt;&lt;br&gt;URL: http://www.h-o</description>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#30</link>
    <pubDate>Thu, 28 Jan 2010 15:17:52 GMT</pubDate>
    <description>К сожалению, это только кажется, что все просто с юридическими текстами. Даже в них встречаются такие синтаксические конструкции, что понять о чем речь можно только по смыслу слов. А задача понимания смысла упирается в задачу создания ИИ. Со всеми вытекающими...&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (PSV)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#29</link>
    <pubDate>Thu, 28 Jan 2010 13:04:36 GMT</pubDate>
    <description>&lt;br&gt;&amp;gt;Распарсить в некоторую структуру. &lt;br&gt;&lt;br&gt;так это уже другая задача :) имеющая впрочем место :)&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (XoRe)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#28</link>
    <pubDate>Thu, 28 Jan 2010 12:37:22 GMT</pubDate>
    <description>Интересна ваша точка зрения на такой способ.&lt;br&gt;Сначала разпарсить фразу, разбить на понятия.&lt;br&gt;Например:&lt;br&gt;Поставщик обязуется поставлять в соответствии с условиями настоящего Договора товар, наименование, количество и цена которого указаны в Приложениях к настоящему Договору (далее по тексту &amp;#8211; &amp;#171;Товар&amp;#187;), а Покупатель обязуется принимать и оплачивать Товар на условиях, указанных в настоящем Договоре.&lt;br&gt;&lt;br&gt;Разделить на &quot;Поставщик&quot;, &quot;обязуется поставлять&quot;, &quot;в соответствии с условиями настоящего Договора&quot;, &quot;указаны в Приложениях&quot; и т.д.&lt;br&gt;&lt;br&gt;Распарсить в некоторую структуру.&lt;br&gt;А потом из неё создавать текст на нужном языке.&lt;br&gt;Я говорю только про юридические документы - они вроде как неплохо структуризированы, плюс используется конечное количество понятий.&lt;br&gt;Правда, я догадываюсь про объем работ)&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (PSV)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#27</link>
    <pubDate>Thu, 28 Jan 2010 07:29:58 GMT</pubDate>
    <description>Это напоминает мне вероятностный расчёт невозможности появления жизни на земле. Там просто берется и рассчитывается вероятность повторения среднего фермента &quot;аминокислота к аминокислоте&quot;. Естественно это неправильно, поскольку фермент работает (не всегда даже снижая свою эффективность) и при отклонениях в последовательности аминокислот его составляющих, главное что бы активный центр остался с точки зрения участников реакции тем же.&lt;br&gt;&lt;br&gt;Столько сколько Вы подсчитали по объему, столько просто не существует текстов, и вполне возможно, даже не было произнесено вообще за всю историю конкретного языка.&lt;br&gt;&lt;br&gt;В Вашем примере достаточно заменить предложение на предложение из предлогов-местоимений-глаголов и подставленных абстрактных &quot;существительных&quot; и &quot;прилагательных&quot;. А для Существительных и Глаголов завести таблицу частоты совместной встречи в одном предложении и в соседнем.&lt;br&gt;&lt;br&gt;Число комбинаций сократится существенно.&lt;br&gt;&lt;br&gt;А если еще не пытаться генерировать все возможные порядки слов, а посмотреть на базе реально сущес</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (HardNik)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#26</link>
    <pubDate>Wed, 27 Jan 2010 23:01:44 GMT</pubDate>
    <description>&amp;gt;Статистические системы переводят с высоким качеством устную речь в текст. Неужели данный &lt;br&gt;&amp;gt;подход окажется столь слабым и неэффективным для перевода с языка на &lt;br&gt;&amp;gt;язык? &lt;br&gt;&lt;br&gt;К сожалению, перлы на перле - детский лепет, по сравнению с фокусами,результатами контекстной зависимости естественных языков.&lt;br&gt;В русском яязыке 200 000 базовых словоформ, 3 000 000 производных, и 5 200 000 семантических единиц из этих словоформ. Средняя длина предложения 10 слов, средняя длина слова 5 символов(цифра странная, но если учесть кол-во одно-двух-буквенных предлогов и союзов, объяснимая) . Непроективность русского языка (я памятник себе воздвиг нерукотворный;памятник  я себе воздвиг нерукотворный;памятник я воздвиг себе нерукотворный;памятник я  воздвиг нерукотворный себе; и тд) позволяет тупо дать оценку для разбора 70&#037; предложений, как число упорядоченных сочетаний по 10 из 5200000 ~= 2E12, только для хранения базы потребуется 2байт* 10слов * 5букв * 2Е12= более 100 000 терабайт. И это для одного языка и попадание  только 70</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#25</link>
    <pubDate>Wed, 27 Jan 2010 18:16:46 GMT</pubDate>
    <description>&amp;gt;Статистические системы переводят с высоким качеством устную речь в текст. Неужели данный &lt;br&gt;&amp;gt;подход окажется столь слабым и неэффективным для перевода с языка на &lt;br&gt;&amp;gt;язык? &lt;br&gt;&lt;br&gt;Ваше заблуждение понятно, но боюсь, это очень разные, не пересекающиеся области.&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (PSV)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#24</link>
    <pubDate>Wed, 27 Jan 2010 12:13:46 GMT</pubDate>
    <description>Статистические системы переводят с высоким качеством устную речь в текст. Неужели данный подход окажется столь слабым и неэффективным для перевода с языка на язык?&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (HardNik)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#23</link>
    <pubDate>Tue, 26 Jan 2010 18:22:06 GMT</pubDate>
    <description>Местами, слегка, я являюсь специалистом по компьютерной лингвистике, и последний год занимаюсь именно машинным переводом.Всё очень плохо начиная с морфологии, синтаксис - это в настоящее время куча костылей, с семантикой ..., впрочем, сходите на http://aot.ru - гляньте на исходники (LGPL), вам точно поплохеет.    Да, заметили вы верно, все технологии Промта пролетают с тупой числодробилкой кластеров гугла. Только это, лишь подтверждает тезис о том, что теория отстала от техники как вирус от млекопитающегося. Лет 50 - это, конечно, много, но 10 - минимум для какого-либо прорыва.&lt;br&gt;  По поводу простых решений - очень вас огорчу. Европейские языки это и венгерский(вспомнит е причины созданияя huspell) и болгарский, который вовсе не славянско-балтийский по синтаксису. Собственно, германские языки - миф, ведь английский типично корневой а немецкий типичный флективный. &lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Евросоюз финансирует проект открытой системы автоматического... (ABC)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/63263.html#22</link>
    <pubDate>Tue, 26 Jan 2010 14:47:32 GMT</pubDate>
    <description>&amp;gt;Если нужен газ, лес и нефть - будут. &lt;br&gt;&lt;br&gt;Дадада, никакой нефти тем, кто не изучит арабский, русский, хауса и йоруба. А чтобы купить Sony Vaio надо обязательно освоить японский!&lt;br&gt;&lt;br&gt;Вам на техническом форуме действительно необходимо блеснуть глупым шовинизмом? &lt;br&gt;</description>
</item>

</channel>
</rss>
