O árabe é falado há cerca de 400 milhão de pessoas em todo o mundo. Portanto é uma das línguas mais difundidas mas, curiosamente, apenas 1% do conteúdo online está em árabe. Isto indica uma possível exclusão digital para muitas pessoas que vivem no Médio Oriente e no Norte de África.
À luz disso, eles foram recentemente desenvolvidos Modelos de IA de código aberto específicos para o idioma árabe. Na verdade, é necessário um trabalho dedicado para poder fazer modelos que sejam confiáveis compreender e responder a aproximadamente 30 dialetos principais, além de suas variações locais e culturais.
Uma obra que, além de representar um passo importante na digitalização dos países de língua árabe, poderá estimular a evolução tecnológica da inteligência artificial globalmente. Vejamos por que e como o tema pode nos interessar no nível profissional.
Índice de conteúdos
Jais: A IA de código aberto para a língua árabe
Jais é um dos modelos de linguagem mais avançados desenvolvidos especificamente para o árabe. Nasceu da colaboração entre Universidade Mohamed bin Zayed de Inteligência Artificial (MBZUAI), G42 e Sistemas de Cerebras, usa 13 bilhões de parâmetros, permitindo uma compreensão aprofundada das peculiaridades da língua árabe, incluindo suas variantes dialetais. A capacidade de Jais de compreender o árabe moderno e os dialetos regionais o diferencia dos modelos genéricos de IA, tornando-o uma ferramenta valiosa para instituições públicas e privadas da região.
A sua acessibilidade, através de plataformas como Abraçando o rosto, permite que desenvolvedores, pesquisadores e acadêmicos usem o modelo para criar aplicativos customizados. Ter tantos parâmetros faz jais um grande modelo de IA de código aberto, mas ainda não é comparável a outros modelos.
Na verdade, existem modelos de IA de código aberto, como Falcão 180B, desenvolvido nos Emirados Árabes Unidos, que Possui 180 bilhões de parâmetros. Vamos ver mais.
Falcon 180B: a resposta árabe ao GPT e ao Bloom
Vamos falar sobre um dos maiores modelos de IA de código aberto já lançados. Foi desenvolvido por Instituto de Inovação Tecnológica (IIT), com sede nos Emirados Árabes Unidos, como parte de seus esforços para impulsionar a pesquisa sobreinteligência artificial na região. Um marco da IA de código aberto em árabe, portanto. No entanto, ao contrário de Jais, é menos específico.
Na verdade Falcão 180B é mais poderoso e responde a muito mais idiomas, mas não é adequado para lidar com precisão com a especificidade dos dialetos e variantes árabes.
ALLaM e a colaboração com a IBM
Outro modelo que abre o mundo árabe ao mercado global de inteligência artificial é ALLaM. Este modelo é interessante porque é desenvolvido pela Autoridade Saudita de Dados e Inteligência Artificial (SDAIA) em colaboração com a IBM. Então está localizado na plataforma watsonx.ai e além de representar mais um passo em direção à democratização da inteligência artificial na língua árabe, é mais um passo deste mundo em direção maiores empresas de IA do mundo.
Este modelo oferece suporte a diversas aplicações, desde agências governamentais até empresas privadas. Além disso, oferece ferramentas para treinamento e customização do modelo de acordo com necessidades específicas.
ALLaM é disponível em versões de 13 bilhões de parâmetros e 7 bilhões de parâmetros.
Como essas IAs árabes de código aberto podem interessar aos profissionais italianos?
Para profissionais italianos especializados desenvolvimento de software, aprendizado de máquina e ciência de dados, estes modelos representam uma oportunidade única para contribuir para o desenvolvimento de tecnologias inovadoras em mercados emergentes.
Do ponto de vista da marketing digital, essas IAs podem ser usadas para melhorar a compreensão das preferências locais e personalizar campanhas publicitárias. Na verdade, vários países de língua árabe estão em forte expansão tecnológica. Portanto, há investimentos que abrem novos mercados e colaborações com startups locais ou multinacionais.
Os profissionais italianos poderiam explorar a sua experiência nestes mercados cíber segurança e computação em nuvem.