Concluyó el doctorado, con mención honorífica, en la Université d'Avignon et des Pays de Vaucluse (Francia, 2014) presentando el primer estudio de generación automática de resúmenes mediante compresión de frases en español. Es miembro fundador de la Asociación Mexicana de Procesamiento de Lenguaje Natural. Fue seleccionado por Microsoft Research para participar en el eScience Workshop 2013 y fue invitado a realizar estancias de colaboración internacional en el IULATERM de Barcelona y en el centro de investigación Xerox Research en Grenoble. Recientemente, ha trabajado para el gobierno de México, primero como experto en Minería de Datos para la Comisión Nacional de Biodiversidad (CONABIO), y actualmente como catedrático CONACyT para el Laboratorio Nacional de Geointeligencia en el Centro de Investigación en Ciencias de Información Geoespacial. Es autor de más de veinte publicaciones científicas arbitradas y un capítulo de libro. Entre sus proyectos recientes destacan: “Detección de Misoginia en redes sociales”, “Biblioteca para la minería de textos de biodiversidad en español” y “Geoparsing para el reconocimiento de entidades nombradas y georreferenciación”.
Áreas de Interés
Inteligencia Artificial, Procesamiento de Lenguaje Natural, Tecnologías del lenguaje, Redes Neuronales, Minería de datos, Aprendizaje Automático, Reconocimiento de Patrones, Modelos estadísticos de predicción, Modelos probabilísticos de lenguaje, Clustering, Lingüística Computacional, GeoParsing.
dblp - Computer Science Bibliography record
ResearchGate
Publons
Desarrollo de tecnologías de la información para el corpus lingüístico del maya yucateco (Development of Information Technologies for the Linguistic Corpus of the Maya Language of Yucatan).
https://www.centrogeo.org.mx/boletin/post/46/2022060902
La extracción automática de información geoespacial en tiempo real, a partir de discurso libre, tendrá un enorme impacto en tecnologías disruptivas, tales como los asistentes inteligentes y los motores de búsqueda. Generar modelos capaces de decodificar el discurso para luego transformarlo en datos estructurados aborda la solución de problemas como: la identificación automática de frases que se refieran a alguna entidad geoespacial; el manejo de sinónimos referidos a una misma locación (ambiguedad); la caracterización taxonómica de expresiones locativas; así como la automatización de procesos complejos de interpretación del lenguaje para la determinación de coordenadas geográficas en mapas y bases de datos. El proyecto Geoparsing tiene por objetivo la automatización de procesos de georreferenciación de documentos digitales para extraer conocimiento georreferenciado.
http://geoparsing.geoint.mx/mx
El proyecto “Misoginia en pocas palabras : Identificación y análisis de violencia escrita contra las mujeres en textos cortos de Twitter” estudia el fenómeno social de la misogina a través de inteligencia computacional. Entre otras cosas, se quiere descubrir, por ejemplo si ¿Existen diferencias significativas en la frecuencia de mensajes misóginos para las distintas entidades geográficas del país? Es decir, ¿en qué ciudades, estados y regiones de México se emiten más tweets con contenido misógino? Eventualmente hasta se podría cruzar esta información con estadísticas de violencia y feminicidios para generar recomendaciones o mapas de riesgo.
Generación de modelos acústicos y modelos probabilísticos de lenguaje que permiten el reconocimiento de voz humana con aplicaciones que van desde la transcripción automática de audio a texto hasta la identificación de llamadas delictivas.
Un algoritmo basado en aprendizaje supervisado que imita las decisiones de los humanos al momento de resumir un texto.
Descargar los datos (corpus anotado en formatos html, csv y xls)
Artículo científico acerca de la metodología
Artículo de divulgación acerca de la anotación de datos mediante crowd science
Un sistema de cómputo de análisis de datos de tráfico vehicular basado en datos de medios digitales, principalmente datos generados por los usuarios de teléfonos celulares y redes sociales.
http://trafico.izt.uam.mx (solo usuarios registrados)
Artículo científico acerca de zonificación de tráfico vehicular y clustering
Un conjunto de programas para procesar y extraer información relevante sobre biodiversidad de manera automática a partir de grandes cantidades de documentos digitales en español.
Artículo científico acerca de la minería de textos de biodiversidad
En curso:
Jonathan Zárate Cartas, estudiante del Doctorado en Ciencias de Información Geoespacial (Septiembre 2020 - en curso).
Hermelando Cruz Pérez, estudiante del Doctorado en Ciencias de Información Geoespacial (Septiembre 2020 - en curso).
Ana Laura Bernal Gómez, estudiante de la Maestría en Ciencias de Información Geoespacial (Septiembre 2019 - en curso).
Concluidas:
"Técnicas de deep learning para resumen automático en español", Ana Beatriz Rodríguez Mendoza, Maestría en Cómputo Estadístico - CIMAT (Junio 2021).
"Reconocimiento de entidades nombradas georeferenciables con Word Embeddings", Jean Michel Arreola Trapala, Maestría en Cómputo Estadístico - CIMAT (Marzo 2020).
"Métodos de desambiguación para Geoparsing en textos en español", Filomeno Alberto Alcántara Alonso, Maestría en Cómputo Estadístico - CIMAT (Marzo 2020).
Segmentation Discursive Automatique, Université d'Avignon et des Pays de Vaucluse (Francia), Ingeniería Informática, Rémy Saksyk.
Aplicación de Técnicas de Minería de Datos para la Zonificación del tráfico de la Ciudad de México, Universidad Autónoma de la Ciudad de México, Ingeniería de Software, Rubén Fernando Estrada.
Yuridia Guadalupe Montelongo Padilla, Maestría en Ciencias en Ingeniería y Tecnologías Computacionales - Cinvestav (Octubre 2021).
Hernán Guillermo Dulcey Morán, Maestría en Ciencias en Ingeniería y Tecnologías Computacionales - Cinvestav (Octubre 2021).
Jose Marco Fuentes Escamilla, Maestría en Ciencias en Ingeniería y Tecnologías Computacionales - Cinvestav (Octubre 2021).
Thomas Catt, Candidato a Doctorado en Ciencias de Información Geoespacial - CentroGeo (Diciembre 2020)
Pablo Lopez Ramirez, Doctorado en Ciencias de Información Geoespacial - CentroGeo (Noviembre 2020)
Shanel Daniela Reyes Palacios, Maestría en Ciencias en Ingeniería y Tecnologías Computacionales - Cinvestav (Septiembre 2020).
Iván Daniel Méndez Álvares, Maestría en Ciencias en Ingeniería y Tecnologías Computacionales - Cinvestav (Diciembre 2019).
Diana Alejandra Martínez Kuri, Maestría en Diseño, Información y Comunicación - UAM (Octubre 2016).
Anaid Simón Ávila, Maestría en Diseño, Información y Comunicación - UAM (Octubre 2016).
Jorge Enrique Cortés Rodríguez, Maestría en Diseño, Información y Comunicación - UAM (Octubre 2016).
Carlos de Jesús Pérez Cerón, Maestría en Diseño, Información y Comunicación - UAM (Octubre 2016).
Karina Yaneth Gazca hernández - Cinvestav (2022).
Unai Atutxa Barrenetxea - HiTZ - Basque Center for Language Technology (2021)
Shanel Daniela Reyes Palacios - Cinvestav (2019).
Jean Michel Arreola Trapala - CIMAT (2019).
Jonatan Efrain Romo Pedroza - CIMAT (2019).
Alexander Peña Melikhov - Instituto Tecnológico de Mérida (2019).
Alejandra Yvette Ramos Torres - UNAM (2017).
Mayra Asli Mendoza Pérez - UAM (2017).
Jesús Arturo Medina Morquecho (2017).
David Flores Ríos - UAM (2016).
Edgar Francisco Moreno Palomino (2016).
Parque Científico Tecnológico Yucatán (PCTY):
Biblioteca Central, Tercer Piso.
Carretera Sierra Papacal - Chuburná Pto. Km 5,
Mérida, Yucatán, México. C.P. 97302.
Teléfono:
(9996) 88-53-00 y 42 - Ext. 1005
Correo:
amolina@centrogeo.edu.mx
Otros:
Skype: alejandromolinavillegas
Las opiniones y datos contenidos en este sitio son de la exclusiva responsabilidad de su(s) autor(es) y no representan el punto de vista de la institución.
2025 © Todos los derechos reservados Laboratorio Nacional de Geointeligencia GeoInt.
Política de privacidad | Términos de servicio