NLP Data Science
Barcelona - Data Science - Full time
Acerca de la posición
El trabajo consiste esencialmente en diseñar, implementar y entrenar algoritmos que extraigan información del texto clínico, así como colaborar en el desarrollo y mantenimiento de los principales productos de nuestra empresa. No trazamos una línea dura entre nuestros equipos de investigación e ingeniería: ambos investigan y desarrollan software de calidad de mercado, poniendo en práctica la investigación previa. Principalmente trabajamos en Python, utilizando nuestras propias bibliotecas NLP y otras de software libre.
Acerca de ti
Debes tener experiencia en tareas no triviales de NLP, así como en creación de datasets para el entrenamiento y evaluación de modelos (coordinando el proceso de anotación, o habiendo anotado tú mismo/a). También debes sentirte cómodo/a programando de manera seria.
Buscamos a alguien a quien le guste trabajar en equipo, enseñar y aprender de otros, y hablar sobre aquello en lo que se está trabajando, tanto con miembros del equipo técnico como no técnicos. Además, podrás preparar comunicaciones científicas acerca del trabajo que has realizado.
Tareas
Es importante que te sientas cómodo adaptándote, dando apoyo al resto del equipo y, definitivamente, puedes esperar:
-
Coordinación de la creación de datasets de NLP médico, y entrenamiento de modelos de NLP. Las tareas son, entre otras:
- Named Entity Recognition
- Named Entity Linking
- Word-sense disambiguation
- Language Modelling
- Text Classification
- Relation Extraction
-
Colaborar en la escritura de papers y posters.
-
Adaptación de los modelos a entornos de producción y a distintos idiomas.
Qué buscamos
-
Experiencia con datasets de NLP, sea usando datasets preexistentes, corrigiéndolos o creándolos desde cero.
-
Conocimiento de Python y librerías útiles para data science (pandas, numpy, sklearn, TensorFlow/PyTorch/Keras.)
-
Conocimiento general de Machine Learning.
-
Experiencia implementando modelos de deep learning para NLP.
-
Se valora:
- Experiencia anotando datasets o coordinando procesos de anotación.
- Nivel alto de portugués.
Qué ofrecemos
- Salario anual: 40.000€ - 45.000€
- Contrato indefinido jornada completa.
- Programa de participación en los beneficios de la empresa.
- Horario flexible y posibilidad de trabajo remoto.
- Un equipo cálido, transparente y solidario, que mantiene el equilibrio entre la vida laboral y personal.
- La mayoría de los días, almuerzo juntos en nuestra terraza soleada.
Acerca de IOMED
IOMED es una empresa tecnológica de nueva creación puntera en el campo de la extracción y el procesamiento masivo de datos médicos. Lo compone un equipo pequeño, unido, joven, dinámico y flexible, que, tras varios años de trabajo en conjunto, se caracteriza por su agilidad, disfrute del trabajo y compenetración. Acorde, buscamos candidatos con ganas de innovar, lanzar un proyecto relevante y crecer con él, siempre disfrutando cada día del trabajo en equipo y de los retos, que son muchos. Nuestro “dream team” está formado por estadísticos, bioinformáticos, gente del mundo de los negocios y la medicina.
En IOMED los modelos que desarrolles analizarán cientos de millones de textos hospitalarios, ayudando a extraer variables que acelerarán la investigación clínica.
Como empleador, ofrecemos igualdad de oportunidades. Todavía somos un equipo pequeño y estamos comprometidos a crecer de manera inclusiva.
Queremos aumentar nuestro equipo con personas talentosas y dinámicas, independientemente de su raza, color, religión, nacionalidad, sexo, discapacidad física o edad.
Qué hacemos
Hoy en día, alrededor del 50% de los ensayos clínicos se retrasan debido al reclutamiento de pacientes, ya que la recopilación de datos de pacientes se realiza de forma manual. Como resultado, la investigación clínica es altamente ineficiente tanto en tiempo como en costo, por lo que lleva años y miles de millones de dólares desarrollar un nuevo medicamento.
Este problema podría resolverse a través de datos del mundo real, es decir, aquellos contenidos en las historias clínicas electrónicas (HCE). Pero desafortunadamente, hasta el 85% de los datos clínicos existentes no están estructurados, es decir, en texto plano.
IOMED ha encontrado la solución a esta situación, haciendo posible aprovechar al máximo el valor de los datos clínicos del mundo real. Desarrollamos una herramienta que extrae los datos necesarios de los textos clínicos, lo que da como resultado una base de datos estructurada, estandarizada e interoperable que contiene la información clínica completa de los hospitales.
De este modo, la información no reutilizable se transforma en datos disponibles para la Investigación clínica, lo que permite incrementar la cantidad de pacientes que cumplen con los criterios, así como reducir el tiempo total y el trabajo manual dedicado a esta tarea.