Linguagem natural (dado não estruturado).
Longa argumentação.
Textos muito longos.
Juridiquês.
Modelos baseados em estatísticas e probabilidades (ex.: análise de frequência, n-grams).
Introdução de corpora anotados para treinamento.
Embeddings são representações numéricas de dados complexos, como palavras, frases, imagens ou até mesmo objetos mais abstratos, em um espaço vetorial de dimensão finita. Imagine transformar um texto inteiro em um único ponto em um gráfico multidimensional!
Prompts no contexto de IA generativa são instruções ou perguntas, acompanhadas ou não de dados ou exemplos a fim de obter respostas desejadas da IA generativa.
1 - Falta de memória persistente
2 - Natureza probabilística: falta de reprodutibilidade
3 - Informação desatualizada
4 - Alucinação
5 - Alto uso de recursos computacionais
6 - Janela limitada
7 - Especificidade do domínio
Melhora o racioncíno da LLM ao orientar a LLM a tomar diferentes caminhos antes de encontrar a solução. Diferentemente do CoT, o ToT não segue um processo linear de raciocínio.
1 - Raciocínio estruturado
2 - Explora múltiplos caminhos
3 - Poda e seleção
4 - Ida e volta
5 - Processo de decisão hierárquico
Restringir a LLM aos dados fornecidos. Forçar respostas. Dar exemplos de respostas.
“Escreva um poema descrevendo um dia lindo<|endofprompt|>. Era um lindo dia de inverno”
Ser imperativo.. ## Dar instruções antes dos exemplos.