Podcast 
LLM
Você sabe o que significa LLM? Neste podcast, você vai conhecer os Large Language Model, ou grandes modelos de linguagem, e como podemos melhorá-los para que não reproduzam preconceito e discriminação.
Referências bibliográficas
BRASIL. Ministério da Ciência, Tecnologia e Inovação. IA para o bem de todos: proposta de plano brasileiro de inteligência artificial 2024-2028. Brasília, DF: MCTI, 29 jul. 2024. Disponível em: www.gov.br/mcti/pt-br/acompanhe-o-mcti/noticias/2024/07/plano-brasileiro-de-ia-tera-supercomputador-e-investimento-de-r-23-bilhoes-em-quatro-anos/ia_para_o_bem_de_todos.pdf. Acesso em: 30 ago. 2024.
GUERRA, Guilherme. Soberania digital: o que é o termo utilizado pelo governo para justificar o plano brasileiro de IA? O Estado de S. Paulo, São Paulo, 9 ago. 2024. Disponível em: www.estadao.com.br/link/cultura-digital/soberania-digital-o-que-e-conceito/. Acesso em: 30 ago. 2024.
RACISMO algorítmico: do que se trata? [S. l.: s. n.], 2022. 1 vídeo (24 min). Publicado pelo canal TV Univap. Disponível em: www.youtube.com/watch?v=GqeaDEMp_PY. Acesso em: 30 ago. 2024.
SILVA, Tarcízio. Racismo algorítmico: inteligência artificial e discriminação nas redes digitais. São Paulo: Sesc, 2022.
Agora que você sabe mais a respeito desses grandes modelos de inteligência artificial especializados em linguagem, faça uma pesquisa sobre algum tema relacionado a raça ou gênero, por exemplo, em um chatbot. Observe se esta ferramenta reproduz preconceitos e estereótipos e discuta com os colegas o resultado de sua pesquisa.
Transcrição
[Música de transição]
[Locutor] Você sabe o que significa a sigla LLM? LLM, abreviatura do inglês large language model, são “grandes modelos de linguagem”. Mas talvez você continue se perguntando: “o que isso significa?”. É o que vamos explicar neste podcast. Os LLMs são modelos de inteligência artificial que funcionam como redes neurais especializadas em linguagem. Esses algoritmos têm grande capacidade de aprendizado e são treinados com base em uma quantidade massiva de dados, como textos, artigos, livros, imagens, informações disponíveis nos servidores de uma empresa ou na internet. Quanto mais informações absorvem, maior a capacidade dos LLMs de compreender e de gerar uma linguagem que podemos chamar de natural. Com essa habilidade desenvolvida, os LLMs passam a gerar diversos tipos de conteúdo, utilizados em uma ampla variedade de tarefas. Como exemplos, temos: os chatbots de atendimento ao cliente instalados em sites de algumas empresas; as interfaces de tradução de idiomas; as plataformas de inteligência artificial que geram textos e imagens que as pessoas usam para os mais diversos fins, entre outros. Outra habilidade dos LLMs é analisar conjuntos de dados para produzir relatórios que vão embasar as decisões nas empresas. A ferramenta faz o trabalho “pesado” para o ser humano. Os primeiros modelos de LLM possuíam recursos muito limitados. Mas a tecnologia tem sido aperfeiçoada nos últimos anos, atingindo altos níveis de excelência e tornando-se adequada para uso em diversos setores.
[Música de transição]
[Locutor] Contudo, os LLMs não realizam análises críticas e não são capazes de entender quando um determinado dado é adequado ou não do ponto de vista ético, político ou social. Eles não julgam, não têm sensibilidade, não possuem “filtro social”, como as pessoas. Apenas reproduzem e criam discursos com a base de dados que possuem. Assim, os LLMs não são isentos de falhas. Um de seus problemas, por exemplo, é o que chamamos de racismo algorítmico. Já ouviu falar? Pois bem, ele ocorre quando a tecnologia toma decisões que reforçam os padrões discriminatórios e racistas da sociedade.
[Especialista Tarcízio Silva] “Se mecanismos de busca ordenam os resultados de acordo com o que já existe na cultura, que já existe publicado de forma visível na sociedade, e reproduz buscas de forma acrítica, a tendência é que ele reproduza discriminações que já são hegemônicas na sociedade, que ainda não superamos, como discriminação de raça, de gênero, capacitismo e outras.”
[Locutor] Você ouviu Tarcízio Silva, autor do livro Racismo algorítmico. Em resumo, os LLMs cometem erros porque nós também falhamos. Lembra que explicamos que a ferramenta aprende por meio de uma base de dados, e que uma de suas fontes é a internet? Sites, redes sociais, fóruns de discussão e portais de notícias são feitos por humanos, a ferramenta apenas absorve e replica as informações que encontra.
[Especialista Tarcízio Silva] “A gente precisa promover mais transparência nas tecnologias e responsabilidade social de quem as desenvolve.”
[Locutor] Ainda há muito a ser realizado no que diz respeito à maior regulamentação das empresas que produzem inteligência artificial generativa, ou seja, essa que cria conteúdos. Um olhar mais abrangente e acolhedor sobre o assunto, principalmente por parte desses grandes conglomerados de tecnologia, poderia aperfeiçoar a ferramenta para evitar problemas como o racismo e a reprodução de estereótipos, por exemplo. Já existem algumas propostas. Uma delas é ampliar a diversidade da base de dados que alimenta o LLM, promovendo a construção de uma internet mais plural. Ter uma equipe de profissionais mais heterogênea trabalhando no desenvolvimento das inteligências artificiais também é positivo. Outra forma de combater o problema é realizar testes prévios, verificando se a ferramenta tem tendência a tratar pessoas de maneira desigual e discriminatória. Também é importante criar grupos de pesquisa, incluindo minorias, para colher a opinião da sociedade sobre a eficiência do sistema. O plano brasileiro de inteligência artificial, lançado em 2024, prevê tornar o país uma referência mundial em inovação e eficiência no uso de IA. A ideia é desenvolver sistemas que melhorem a entrega de serviços públicos e promovam a inclusão social. Uma das preocupações é justamente ampliar e melhorar o uso de IA, para que ninguém seja vítima de discriminação.
[Música de encerramento]
[Locutor] Créditos: O trecho do vídeo Racismo algorítmico: do que se trata? foi publicado em março de 2022 e está disponível no canal TV Univap, no YouTube. Os outros áudios inseridos neste conteúdo são da Freesound.