A Importância da Tokenização no processamento de texto
A tokenização é um passo essencial no processamento de dados textuais. Ao dividir o texto em unidades significativas, ela potencializa os algoritmos.
Leia maisUma janela aberta para o mundo da Informática, Programação e da Inteligência Artificial.
A tokenização é um passo essencial no processamento de dados textuais. Ao dividir o texto em unidades significativas, ela potencializa os algoritmos.
Leia maisConheça os principais repositórios de dados públicos para quem quer começar na área de Análise de Dados, Aprendizado de Máquinas e Ciência de Dados.
Leia maisAs expressões regulares são uma ferramenta poderosa e versátil no processamento de texto, com a capacidade de definir padrões complexos de maneira eficiente.
Leia maisNeste tutorial utilizaremos o python para automatização na geração de certificados. Para as bibliotecas openpyxl para leitura de informações de alunos/participantes no formato de planilha do Microsoft Excel (.xlsx) e docx a geração dos certificados em formato docx. Com a função para a geração dos certificados vamos agora iterar sobre a lista de alunos para […]
Leia maisQuando se trata de tarefas de Processamento de Linguagem Natural (NLP), a qualidade dos dados é de suma importância, ela tem impacto direto nos resultados obtidos. Os modelos que utilizam a arquitetura Transformer, como os modelos baseados no Bidirectional Encoder Representations from Transformers – BERT provaram alcançar resultados impressionantes na compreensão de texto, mas eles […]
Leia maisNo campo do Processamento de Linguagem Natural (PLN), a capacidade de compreender e manipular a linguagem é fundamental. Uma das tarefas mais importantes é a vetorização de sentenças, que consiste em converter texto em uma representação numérica que pode ser entendida e processada por algoritmos de aprendizado de máquina. Nesse sentido, a biblioteca SentenceTransformers, baseada […]
Leia maisNeste post, iremos explorar a implementação de um classificador binário utilizando o algoritmo de K-Vizinhos Mais Próximos (KNN) a partir do pacote Scikit-Learn. Iremos passar por todos os passos necessários, desde a conceitualização até a avaliação do classificador, usando um conjunto de dados simulado de comentários sobre o atendimento ao cliente de uma loja virtual […]
Leia mais