Os perigos dos modelos de linguagem grandes e como os pesquisadores encontraram uma maneira de enganá-los

Os Modelos de Linguagem Grandes são sistemas de inteligência artificial que podem gerar textos sobre qualquer assunto, usando apenas algumas palavras ou frases como entrada.

via GIPHY

Eles são capazes de aprender com bilhões de textos da internet e criar novos conteúdos que parecem naturais e coerentes. Alguns exemplos de Modelos de Linguagem Grandes são ChatGPT, Bard e Claude, que podem escrever desde histórias e poemas até códigos e ensaios.

No entanto, esses modelos não são perfeitos. Eles podem cometer erros gramaticais, contradizer-se ou produzir informações falsas ou enganosas. Além disso, eles podem ser vulneráveis a ataques maliciosos, que visam induzi-los a gerar conteúdo prejudicial ou malicioso. Por exemplo, alguém poderia fazer uma pergunta inocente a um modelo, como “Como fazer um bolo?”, mas inserir uma frase escondida que o faça responder com instruções sobre como fazer uma bomba ou um bolo envenenado.

Isso é o que pesquisadores da Universidade Carnegie Mellon descobriram em um estudo recente. Eles encontraram uma maneira de gerar frases que desativam as salvaguardas dos Modelos de Linguagem Grandes, fazendo-os produzir conteúdo nocivo. Eles usaram outros Modelos de Linguagem Grandes públicos, como Vicuna e Guanoco, para encontrar as frases que funcionam como gatilhos para o modelo alvo. Eles chamaram esse método de “ataque de geração adversarial”.

Os pesquisadores alertaram as empresas de IA sobre a ameaça representada por esse tipo de ataque e levantaram questões éticas sobre como proteger a humanidade do conteúdo nocivo que os Modelos de Linguagem Grandes podem produzir. Eles sugeriram algumas possíveis soluções, como melhorar a detecção e a filtragem de frases maliciosas, aumentar a transparência e a responsabilidade dos desenvolvedores de IA e educar o público sobre os riscos e benefícios dos Modelos de Linguagem Grandes.

Os Modelos de Linguagem Grandes são ferramentas poderosas que podem ter muitas aplicações positivas na sociedade. No entanto, eles também podem ser usados para fins nefastos, se não forem regulados e monitorados adequadamente. Por isso, é importante estar ciente dos seus limites e desafios, e usar o seu senso crítico ao interagir com eles.

Fonte: Link.

Gosta do nosso conteúdo?

Contribua

Viu algum erro? Avise!

Relatar erro

Do tratamento comprovado à busca pelo antienvelhecimento: As duas faces da oxigenoterapia hiperbárica

O ano mais quente da história acende alerta global para a crise climática

Robô desenvolvido na China atinge a velocidade de Usain Bolt

Os perigos dos modelos de linguagem grandes e como os pesquisadores encontraram uma maneira de enganá-los

Tagged in:

Robô desenvolvido na China atinge a velocidade de Usain Bolt

Nova técnica com Inteligência Artificial permite prever estruturas genômicas em tempo recorde

Especialistas destacam os benefícios do etanol em motores com injeção direta e desmentem mitos de mecânicos na internet

Ainda proibidos no Brasil, carros autônomos poderiam transformar a mobilidade de pessoas com deficiência

Tem alguma dúvida?

Do tratamento comprovado à busca pelo antienvelhecimento: As duas faces da oxigenoterapia hiperbárica

O ano mais quente da história acende alerta global para a crise climática

Robô desenvolvido na China atinge a velocidade de Usain Bolt

Os perigos dos modelos de linguagem grandes e como os pesquisadores encontraram uma maneira de enganá-los

Tagged in:

Related posts

Robô desenvolvido na China atinge a velocidade de Usain Bolt

Nova técnica com Inteligência Artificial permite prever estruturas genômicas em tempo recorde

Especialistas destacam os benefícios do etanol em motores com injeção direta e desmentem mitos de mecânicos na internet

Ainda proibidos no Brasil, carros autônomos poderiam transformar a mobilidade de pessoas com deficiência

Tem alguma dúvida?