Automação

Antifraude com IA: Como Sistemas de Deteccao de Fraude Funcionam na Pratica

Antifraude com IA: Como Sistemas de Deteccao de Fraude Funcionam na Pratica

Fraudes digitais custam bilhoes de reais ao ano no Brasil. Bancos, fintechs, e-commerces e marketplaces usam sistemas de inteligencia artificial para detectar transacoes fraudulentas em tempo real. Este guia explica como esses sistemas funcionam tecnicamente e como voce pode construir um.

Tipos de fraude digital

Fraude de identidade: uso de dados pessoais roubados (CPF, cartao de credito) para criar contas ou fazer compras. Fraude de transacao: uso de cartao clonado ou credenciais roubadas para transacoes financeiras. Account takeover: invasao de conta legitima para fazer transacoes fraudulentas. Fraude de primeiro pagamento: criacao de conta nova, compra com pagamento fraudulento e recebimento do produto antes do estorno. Fraude amigavel: o proprio titular contesta uma compra legitima alegando nao reconhecer. Fraude de marketplace: vendedores falsos que recebem pagamento e nao entregam o produto.

Arquitetura de um sistema antifraude

A arquitetura tipica de um sistema antifraude em producao:

Camada de coleta: captura dezenas de sinais em cada transacao — device fingerprint (identificacao unica do dispositivo), IP e geolocalizacao, historico de transacoes do usuario, velocidade de digitacao e padrao de navegacao, horario da transacao, valor em relacao ao historico.

Motor de regras: regras deterministicas para fraudes obvias — bloquear se o IP esta em lista negra, bloquear se mais de 5 tentativas com cartoes diferentes em 10 minutos, bloquear se o dispositivo e novo e o valor e acima de R$ 1000.

Modelo de ML: para fraudes mais sofisticadas que regras simples nao pegam. O modelo recebe as features e retorna um score de risco (0-100). Acima de um threshold (ex: 80), a transacao e bloqueada ou enviada para analise manual.

Construindo um modelo de deteccao

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# Carregar dados historicos de transacoes
df = pd.read_csv(“transacoes.csv”)

# Features relevantes
features = [
“valor”, “hora_do_dia”, “dia_da_semana”,
“dispositivo_novo”, “ip_novo”, “distancia_km_ultima_transacao”,
“tempo_desde_ultima_transacao_min”, “tentativas_ultimas_24h”,
“total_gasto_ultimos_7_dias”, “qtd_cartoes_diferentes_30_dias”
]

X = df[features]
y = df[“fraude”] # 0 = legit, 1 = fraude

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)

# Random Forest com class_weight para lidar com desbalanceamento
modelo = RandomForestClassifier(n_estimators=200, class_weight=”balanced”, random_state=42)
modelo.fit(X_train, y_train)

y_pred = modelo.predict(X_test)
print(classification_report(y_test, y_pred))

O desafio do desbalanceamento

Em dados reais, fraudes representam menos de 1% das transacoes (tipicamente 0.1-0.5%). Isso cria um desbalanceamento severo: o modelo pode atingir 99% de acuracia simplesmente classificando tudo como legitimo e errando todas as fraudes.

Tecnicas para lidar: SMOTE (Synthetic Minority Over-sampling Technique) para gerar exemplos sinteticos de fraude, class_weight=”balanced” nos modelos, usar metricas como Precision, Recall e F1-score em vez de acuracia simples, ajustar o threshold de decisao para priorizar recall (pegar mais fraudes) mesmo com mais falsos positivos.

A metrica principal de um sistema antifraude: taxa de chargeback (estornos). Se esta abaixo de 1%, o sistema esta funcionando bem. Abaixo de 0.5% e excelente.

Features de device fingerprint

Device fingerprint e a identificacao unica de um dispositivo baseada em suas caracteristicas: user agent, resolucao de tela, timezone, plugins instalados, Canvas fingerprint (renderizacao de um canvas HTML5 que varia por hardware), WebGL fingerprint, fontes instaladas.

Bibliotecas como FingerprintJS (open source) ou SEON (pago) geram um hash unico do dispositivo que permite identificar se o mesmo aparelho esta sendo usado para multiplas contas ou atividades suspeitas.

Servicos antifraude prontos

Para empresas que nao querem construir do zero: ClearSale (lider no Brasil), Konduto (adquirida pela Boa Vista), SEON (global, device intelligence), Stripe Radar (integrado ao Stripe), Emailage (validacao de risco por email).

Esses servicos combinam modelos de ML treinados com bilhoes de transacoes, bases de dados de dispositivos e IPs fraudulentos, e equipes de analise manual para casos ambiguos.

Tem um projeto em mente?

Somos especialistas em transformar ideias em produtos digitais. Apps, sites, automações e IA — vamos construir juntos.

Resposta rápida Orçamento sem compromisso +100 projetos entregues
Compartilhar: