Extracción de información: en busca de la semántica textual (II)

Por Domingo Senise, fundador y CEO de hAItta Tareas clásicas en Extracción de información, independientes del dominio La tarea clásica, independiente del dominio, en Extracción de información es el análisis lingüístico. Se compone de los siguientes pasos: Análisis de meta-datos: extracción del título, la estructura del texto (identificación de párrafos) y la fecha del documento. Tokenización: segmentación del texto en unidades similares a palabras, que son denominadas tokens, y clasificación de sus tipos; a saber, identificación de palabras en mayúsculas, minúsculas, palabras con guión, signos de puntuación,



Mas contenidos de / Innova Spain

La energía de los emprendedores: abierta una nueva convocatoria de la aceleradora de Fundación Repsol

Innova Spain Archivo: Aceleradoras
Ya está abierto el periodo de inscripción a una nueva edición del #FondoEmprendedores de Fundación Repsol (@FundacionRepsol), una iniciativa que pretende apoyar el talento emprendedor de startups innovadoras

Talgo y CSIC recompensan y alaban a la Formación Profesional

Innova Spain Archivo: Eventos | Premios |
Talgo, a través de su Fundación, y el Consejo Superior de Investigaciones Científicas (CSIC) han entregado los premios Fundación TALGO – CSIC 2017 a la Soldadura en la Formación Profesional

Tambien te puede interesar