ChatGPT: por que todo mundo está falando sobre isso?

ChatGPT por que todo mundo está falando sobre isso

Durante o verão, convidamos você a encontrar os artigos distribuídos este ano no site. Hoje um artigo publicado originalmente em 16/01/2023.

La lançamento do ChatGPT em 30 de novembro marcou uma nova etapa no desenvolvimento de tecnologias de processamento de linguagem. De qualquer forma, é a primeira vez que um sistema de IA, resultante diretamente da pesquisa, desperta tanto entusiasmo: vários artigos apareceram na imprensa especializada, mas também geral. O ChatGPT (ou OpenAI, a empresa que desenvolve o ChatGPT, ou ambos) são tendências consistentes no Twitter até hoje.

Por que tal eco? Os recursos do ChatGPT são diferentes das tecnologias anteriores capazes de gerar texto?

ChatGPT pode conversar

Claramente, o ChatGPT permitiu um salto qualitativo: é capaz de responder, de forma muitas vezes relevante, a quase todas as questões em linguagem natural. GPT2, depois GPT3 – os modelos de linguagem anteriores desenvolvidos pela OpenAI – já eram muito bons em gerar texto a partir de algumas palavras ou frases dadas como prompts (o que é chamado de "prompt"): frequentemente falávamos de "papagaios" (papagaios estocásticos), como proposto Emily Bender, e muitos outros pesquisadores comentários dessas técnicas. Com efeito, poder-se-ia dizer que estes sistemas produziram texto a partir de fragmentos de frases retiradas dos imensos corpora à sua disposição... um texto original retomando, parafraseando, combinando elementos vistos em vários corpora.

O ChatGPT assume essas características, mas a parte "chat" (diálogo) adiciona uma dimensão completamente diferente a ela e, muitas vezes, parece impressionante.

O sistema não produz mais apenas um parágrafo de uma frase fornecida como entrada. Ele agora é capaz de responder corretamente a perguntas simples e complexas, pode fornecer elementos de raciocínio, falar idiomas diferentes, analisar ou produzir código de computador, entre outras coisas.

Por exemplo, se perguntado se dois personagens puderam se encontrar, o sistema é capaz de determinar as datas correspondentes à sua existência, compare essas datas e deduza uma resposta. Isso é trivial para um ser humano, mas nenhum sistema até agora poderia responder a esse tipo de pergunta com tanta precisão sem ser altamente especializado. Além do idioma, o ChatGPT também pode fornecer elementos do raciocínio matemático (mas muitas vezes ele está errado) E analisar código de computador inclusive.

Deste ponto de vista, o ChatGPT está um passo à frente de seus concorrentes.

ChatGPT, um sistema fechado

Quanto ao funcionamento do sistema, difícil falar mais, pois o OpenAI, apesar do nome, desenvolve sistemas fechados. Ou seja, o código informático (código fonte) utilizado não está disponível e as pesquisas relacionadas com o ChatGPT permanecem para o momento em grande parte um segredo comercial – ainda que, obviamente, deoutras equipes estão trabalhando em sistemas semelhantes, também baseado em aprendizado profundo. Assim temos uma ideia do que é utilizado pelo OpenAI.

Outras empresas mantiveram um modelo mais aberto, por exemplo a Meta com o trabalho realizado na FAIR, geralmente aberto e publicado nas principais conferências da área. Mas, de forma mais geral, estamos vendo cada vez mais um fechamento da pesquisa. Por exemplo, enquanto a Apple sempre teve um modelo de desenvolvimento privado e muito secreto, Deepmind tinha um modelo aberto e provavelmente é um pouco menos, agora que a empresa está sob o controle do Google.

O próprio sistema ChatGPT pode se tornar comercial: OpenAI é financiado pela Microsoft que pode decidir fechar o acesso ao sistema um dia em breve, se for do seu interesse.

Ao testar o ChatGPT, você contribui (gratuitamente) para melhorá-lo

Enquanto isso, a OpenAI se beneficia da enorme publicidade que sua ferramenta traz para ela e também de todas as interações do usuário com ela. Se um usuário relatar que uma resposta não é boa, ou pedir à ferramenta para reformular sua resposta levando em consideração um elemento adicional, esta é toda a informação que o sistema armazena e pode reutilizar para refinar sua resposta na próxima vez, na solicitação solicitada ou em um pedido semelhante. Ao testar o ChatGPT, trabalhamos de graça para OpenAI !

Voltando ao próprio sistema, a parte do diálogo é, portanto, o que faz a força e a particularidade do ChatGPT (comparado ao GPT3, por exemplo). Não é mais um modelo de linguagem "simples" capaz de gerar texto "ao quilômetro", mas um verdadeiro sistema de diálogo. Este provavelmente se beneficiou de milhões ou bilhões de exemplos avaliado por humanos, e a fase atual – onde centenas de milhares de usuários “jogam” quase de graça com o sistema – ainda permite que ele seja continuamente aprimorado, já que obviamente todas as interações são registradas e utilizadas para isso.

Agora é bastante simples acessar corpora de bilhões de palavras para desenvolver um modelo de linguagem do tipo "GPT", pelo menos para idiomas que são difundidos na Internet.

Mas os dados que permitiram o desenvolvimento do ChatGPT (diálogos, interações com humanos) não são públicos, e é isso que dá ao OpenAI uma vantagem significativa sobre a concorrência.

Por exemplo, o Google tem dados diferentes, mas sem dúvida também utilizáveis ​​para esse tipo de sistema - especialmente porque o Google vem desenvolvendo há vários anos um gráfico de conhecimento que poderia gerar respostas com melhor confiabilidade do que o ChatGPT. Em particular, a análise das sequências de consultas do buscador do Google poderia fornecer informações valiosas para orientar a interação com o usuário... Mas, por enquanto, é o OpenAI que tem o ChatGPT, e não o Google: o OpenAi leva vantagem.

Além do ChatGPT, quais aplicativos no futuro?

De fato, embora seja possível ignorar os limites do ChatGPT, o sistema se recusa a explicar como criar uma bomba, produzir contos eróticos ou dar sentimentos a ela (ChatGPT freqüentemente responde que ela é uma máquina, queela não tem sentimentos ou personalidade). A OpenAI obviamente cuidou de sua comunicação. A empresa também teve o cuidado extremo de “blindar” o sistema, para permitir que ele driblasse a maioria das armadilhas que podem arruinar esse tipo de aplicativo em poucas horas, como costuma acontecer com sistemas abertos ao público em geral.

Podemos, por exemplo, citar a Meta, que em novembro passado teve que retirar seu sistema chamado “Galactica” dois dias depois de colocá-lo online. A Galactica foi treinada no campo científico e projetada para oferecer serviços a pesquisadores. Ele foi apresentado pela primeira vez como capaz de escrever artigos científicos automaticamente a partir de um prompt… antes que a empresa esclarecesse que era obviamente apenas uma ajuda editorial. Mas essa infeliz estratégia de comunicação gerou uma controvérsia que forçou a Meta a desconectar rapidamente a Galactica.

Por outro lado, o ChatGPT ainda está online e ainda desperta tanta paixão entre um grande público. As perguntas permanecem, no entanto: que impacto o ChatGPT terá? Quais aplicações serão derivadas dele? E que modelo econômico a empresa OpenAI (e a Microsoft, sua principal investidora) almeja?

Thierry poibeau, DR CNRS, École normale supérieure (ENS) - PSL

Este artigo foi republicado a partir de A Conversação sob licença Creative Commons. Leia oartigo original.

Crédito da imagem: Shutterstock/ Adansijav Official

Na seção Mídia >



Notícias recentes >