Concluyó el doctorado, con mención honorífica, en la Université d'Avignon et des Pays de Vaucluse (Francia, 2014) presentando el primer estudio de generación automática de resúmenes mediante compresión de frases en español. Es miembro fundador de la Asociación Mexicana de Procesamiento de Lenguaje Natural. Fue seleccionado por Microsoft Research para participar en el eScience Workshop 2013 y fue invitado a realizar estancias de colaboración internacional en el IULATERM de Barcelona y en el centro de investigación Xerox Research en Grenoble. Recientemente, ha trabajado para el gobierno de México, primero como experto en Minería de Datos para la Comisión Nacional de Biodiversidad (CONABIO), y actualmente como catedrático CONACyT para el Laboratorio Nacional de Geointeligencia en el Centro de Investigación en Ciencias de Información Geoespacial. Es autor de más de veinte publicaciones científicas arbitradas y un capítulo de libro. Entre sus proyectos recientes destacan: “Detección de Misoginia en redes sociales”, “Biblioteca para la minería de textos de biodiversidad en español” y “Geoparsing para el reconocimiento de entidades nombradas y georreferenciación”.
Áreas de Interés
Inteligencia Artificial, Procesamiento de Lenguaje Natural, Tecnologías del lenguaje, Redes Neuronales, Minería de datos, Aprendizaje Automático, Reconocimiento de Patrones, Modelos estadísticos de predicción, Modelos probabilísticos de lenguaje, Clustering, Lingüística Computacional, GeoParsing.
dblp - Computer Science Bibliography record
ResearchGate
Publons
La extracción automática de información geoespacial en tiempo real, a partir de discurso libre, tendrá un enorme impacto en tecnologías disruptivas, tales como los asistentes inteligentes y los motores de búsqueda. Generar modelos capaces de decodificar el discurso para luego transformarlo en datos estructurados aborda la solución de problemas como: la identificación automática de frases que se refieran a alguna entidad geoespacial; el manejo de sinónimos referidos a una misma locación (ambiguedad); la caracterización taxonómica de expresiones locativas; así como la automatización de procesos complejos de interpretación del lenguaje para la determinación de coordenadas geográficas en mapas y bases de datos. El proyecto Geoparsing tiene por objetivo la automatización de procesos de georreferenciación de documentos digitales para extraer conocimiento georreferenciado.
http://geoparsing.geoint.mx/mx
El proyecto “Misoginia en pocas palabras : Identificación y análisis de violencia escrita contra las mujeres en textos cortos de Twitter” estudia el fenómeno social de la misogina a través de inteligencia computacional. Entre otras cosas, se quiere descubrir, por ejemplo si ¿Existen diferencias significativas en la frecuencia de mensajes misóginos para las distintas entidades geográficas del país? Es decir, ¿en qué ciudades, estados y regiones de México se emiten más tweets con contenido misógino? Eventualmente hasta se podría cruzar esta información con estadísticas de violencia y feminicidios para generar recomendaciones o mapas de riesgo.
Generación de modelos acústicos y modelos probabilísticos de lenguaje que permiten el reconocimiento de voz humana con aplicaciones que van desde la transcripción automática de audio a texto hasta la identificación de llamadas delictivas.
Un algoritmo basado en aprendizaje supervisado que imita las decisiones de los humanos al momento de resumir un texto.
Descargar los datos (corpus anotado en formatos html, csv y xls)
Artículo científico acerca de la metodología
Artículo de divulgación acerca de la anotación de datos mediante crowd science
Un sistema de cómputo de análisis de datos de tráfico vehicular basado en datos de medios digitales, principalmente datos generados por los usuarios de teléfonos celulares y redes sociales.
http://trafico.izt.uam.mx (solo usuarios registrados)
Artículo científico acerca de zonificación de tráfico vehicular y clustering
Un conjunto de programas para procesar y extraer información relevante sobre biodiversidad de manera automática a partir de grandes cantidades de documentos digitales en español.
Artículo científico acerca de la minería de textos de biodiversidad
En curso:
Reconocimiento de entidades georeferenciables con word embeddings, CIMAT-CentroGeo, Maestría en Computo Estadístico, Jean Arreola.
Métodos de Desambiguación para Geoparsing en textos en español, CIMAT-CentroGeo, Maestría en Computo Estadístico, Filomeno Alcántara.
Concluidas:
Parque Científico Tecnológico Yucatán (PCTY):
Biblioteca Central, Tercer Piso.
Carretera Sierra Papacal - Chuburná Pto. Km 5,
Mérida, Yucatán, México. C.P. 97302.
Teléfono:
(9996) 88-53-00 y 42 - Ext. 1005
Correo:
amolina@centrogeo.edu.mx
Otros:
Skype: alejandromolinavillegas
dblp - Computer Science Bibliography
@DATANLAB
@CICIGE
2024 © Todos los derechos reservados. Política de privacidad | Términos de servicio