O que é ChatGPT | GPT-3? Como funciona?

ChatGPT é uma aplicação que utiliza um famoso modelo de inteligência artificial chamado GPT-3. Esse modelo foi lançado em 2020 pela empresa OpenAI, revolucionando o mundo do processamento de texto e linguagem natural

Primeiro, veio o modelo GPT, em 2018. Um ano depois, foi lançado o GPT-2. Mais um ano depois, chegou o GPT-3. Cada nova atualização trouxe uma melhora expressiva na qualidade do modelo.

O modelo GPT-3 passou por uma leve atualização no final de 2022, a partir do feedback de pessoas que interagiram e informaram para o modelo o quanto estavam gostando ou não das respostas. Por esse motivo, alguns estão chamando esse modelo de GPT 3.5. No início de 2023, a OpenAI deve lançou a versão GPT-4. 

Desde então, outras empresas começaram a investir pesado também nos seus próprios modelos. 

Todos eles têm algo em comum: a arquitetura de “transformer”. Ao compreender o que é um transformer e como funciona, você irá entender em detalhes como o chatgpt e os grandes modelos de linguagem (LLMs) funcionam. Esse vídeo abaixo explica isso em detalhes:

O principal destaque do ChatGPT é a capacidade de conseguir não apenas se comunicar, mas também apresentar uma espécie de raciocínio lógico. É possível interagir com a máquina como se ela fosse uma pessoa com muito conhecimento. 

Entenda melhor como essa técnica funciona no segundo vídeo acima. Você vai aprender como o ChatGPT pensa e de onde vem a inteligência do modelo. 

Para entender algumas das limitações desses modelos, leia esse paper de Natanael W. Fraga.