Продукты искусственного интеллекта на основе языка распределены неравномерно

*(версия логотипа на португальском языке на английском языке)*

Если вы погуглите «корпус языка X», вы увидите, что английский — это язык с наибольшим количеством документации и корпусов. При этом английский язык стал «международным языком». Из-за этого большинство языковых моделей и языкового ИИ работают только и/или лучше с английским языком. Более того, мы видим множество приложений, которые работают с речью или письменными словами; но как часто вы видите что-то для жестовых языков?

В некоторых наборах языковых данных были переведены тексты с английского на несколько других языков. Я понимаю, что есть определенный уровень удобства, потому что это быстрее и дешевле, чем собирать данные с этих языков в реальных текстах. Однако в английском языке есть структуры, которые даже не придуманы в других языках; тогда почему мы должны использовать машинно переведенные тексты для обучения машин перевода или языковых моделей? Точно так же возьмем в качестве примера португальский язык (учитывая все его разновидности): на нем много носителей, но не так много инструментов ИИ для него. Вы можете себе представить сценарий для языков с меньшим количеством носителей?!

По данным Всемирной федерации глухих, в мире насчитывается более 70 миллионов глухих (https://www.un.org/en/observances/sign-languages-day). Это очень много людей! Тем не менее, существует не так много приложений ИИ, специализирующихся на языках жестов. Конечно, возникают проблемы: прослушивание видео, аннотирование видеоданных, этика компиляции и т. д. В любом случае, языки жестов не должны оставаться в стороне от гонки ИИ.

Не поймите меня неправильно: я не хочу дисквалифицировать то, что было сделано до сих пор! Просто хочу поднять тему для размышления. Мы не должны продолжать технологическую революцию без критического мышления и справедливости.

Что еще мы должны обсудить по этому поводу?

P.S.: Кроме того, люди с нарушением речи могли бы извлечь выгоду из продуктов ИИ, но я не видел продукта, который удовлетворял бы потребности этих людей. Отражение представлено Катериной Бонан [https://www.linkedin.com/in/caterinabonan/]

==================================================================

Se você pesquisar no Google «corpus da língua X», verá que o englês é o idioma com mais documentação e corpora. Paralelamente, o inglês tornou-se a «lingua internacional». Por causa disso, a maioria dos modelos de linguagem e IA baseada em linguagem funciona apenas e/ou melhor com o inglês. Além disso, vemos muitos aplicativos que lidam com palavras faladas ou escritas; mas com Que frequência você vê algo para línguas de sinais?

Alguns conjuntos де дадос де идиомы тем textos traduzidos сделать английский пункт vários outros идиомы. Eu entendo Que Há Algum Nível де Conveniência porque é mais rápido E barato сделать Que Coletar Dados Desses idiomas em textos da vida real. No entanto, existsem estruturas em inglês que nem sequer são concebidas em outras linguas; então, por Que deveríamos usar textos traduzidos para treinar máquinas de tradução ou modelos de linguagem? Da mesma forma, por instanceo, o português (considerando todas as suas Variades) tem muitos falantes, mas não tem muitas ferramentas de IA para isso. Já imaginou или cenário para idiomas com menos falantes?!

Segundo a Federação Mundial de Surdos, exists mais de 70 milhões de surdos em todo o mundo (https://www.un.org/en/observances/sign-languages-day). É muita gente! Нет entanto, не существует muitos aplicativos де IA especializados em linguas de sinais. É claro Que Surgem Desafios: Gravação de Vídeo, anotação de Dados de Vídeo, ética por trás da compilação и т. д. De qualquer forma, as línguas de sinais não devem ser deixadas de fora da corrida da IA.

Não meterpretem mal: não quero desqualificar o que foi feito até agora! Só Quero trazer ум тема пункт reflexão. Não devemos continuar revolução tecnológica sem pensamento critico e equidade.

Que outras coisas devemos discutir sobre isso?

PS: tambem, pessoas com problemas de fala poderiam se beneficiar de produtos de IA, mas não vi um produto que atendesse às necessidades desses indivíduos. Reflexão trazida por Caterina Bonan [https://www.linkedin.com/in/caterinabonan/]