Ir para o conteúdo

DataFrameIt

Enriqueça DataFrames com LLMs de forma simples e estruturada

PyPI version Python 3.10+ License: MIT

O que é?

DataFrameIt processa textos em DataFrames usando Modelos de Linguagem (LLMs) e extrai informações estruturadas definidas por modelos Pydantic. Uma função, um modelo, um prompt — pronto.

from pydantic import BaseModel
from typing import Literal
import pandas as pd
from dataframeit import dataframeit

class Sentimento(BaseModel):
    sentimento: Literal['positivo', 'negativo', 'neutro']
    confianca: Literal['alta', 'media', 'baixa']

df = pd.DataFrame({'texto': ['Produto excelente!', 'Péssimo serviço.']})
resultado = dataframeit(df, Sentimento, "Analise o sentimento do texto.")

Funcionalidades

Múltiplos Providers

Google Gemini, OpenAI GPT-5, Anthropic Claude 4.5, Cohere, Mistral — todos via LangChain.

Saída Estruturada

Validação automática com Pydantic. Defina campos, tipos e descrições — o LLM respeita.

Resiliência

Retry automático com backoff exponencial. Rate limiting configurável. Nunca perde progresso.

Performance

Processamento paralelo com auto-ajuste. Métricas de throughput em tempo real.

Busca Web

Integração com Tavily para enriquecer dados com informações da internet.

Múltiplas Entradas

DataFrame, Series, lista, dicionário — tudo funciona. Polars incluído.

Instalação Rápida

pip install dataframeit[google]  # Google Gemini 3 (recomendado)
pip install dataframeit[openai]  # OpenAI GPT-5
pip install dataframeit[anthropic]  # Anthropic Claude 4.5

Próximos Passos