NLP Data Science

Barcelona - Data Science - Full time

Competitive salary
Última actualización: December 24, 2021

Acerca de la posición 

El trabajo consiste esencialmente en diseñar, implementar y entrenar algoritmos que extraigan información del texto clínico, así como colaborar en el desarrollo y mantenimiento de los principales productos de nuestra empresa. No trazamos una línea dura entre nuestros equipos de investigación e ingeniería: ambos investigan y desarrollan software de calidad de mercado, poniendo en práctica la investigación previa. Principalmente trabajamos en Python, utilizando nuestras propias bibliotecas NLP y otras de software libre. 

Acerca de ti 

Debes tener experiencia en tareas no triviales de NLP, así como en creación de datasets para el entrenamiento y evaluación de modelos (coordinando el proceso de anotación, o habiendo anotado tú mismo/a). También debes sentirte cómodo/a programando de manera seria.

Buscamos a alguien a quien le guste trabajar en equipo, enseñar y aprender de otros, y hablar sobre aquello en lo que se está trabajando, tanto con miembros del equipo técnico como no técnicos. Además, podrás preparar comunicaciones científicas acerca del trabajo que has realizado. 

Tareas 

Es importante que te sientas cómodo adaptándote, dando apoyo al resto del equipo y, definitivamente, puedes esperar:

  • Coordinación de la creación de datasets de NLP médico, y entrenamiento de modelos de NLP. Las tareas son, entre otras: 

    • Named Entity Recognition 
    • Named Entity Linking 
    • Word-sense disambiguation 
    • Language Modelling 
    • Text Classification 
    • Relation Extraction 
  • Colaborar en la escritura de papers y posters. 

  • Adaptación de los modelos a entornos de producción y a distintos idiomas.

Qué buscamos 

  • Experiencia con datasets de NLP, sea usando datasets preexistentes, corrigiéndolos o creándolos desde cero.
  • Conocimiento de Python y librerías útiles para data science (pandas, numpy, sklearn, TensorFlow/PyTorch/Keras.) 
  • Conocimiento general de Machine Learning. 
  • Experiencia implementando modelos de deep learning para NLP.

Nice to have:

  • Experiencia anotando datasets o coordinando procesos de anotación.
  • Nivel alto de portugués.

Qué ofrecemos

  • Salario competitivo.
  • Contrato indefinido a jornada completa.
  • Plan de participación en los beneficios de la empresa valorado en hasta 10.000 € al año.
  • Retribución flexible con ticket restaurante, ticket transporte, guardería, formación y seguro médico.
  • Horario flexible, con posibilidad de despacho a domicilio. 
  • 28 días de vacaciones al año.
  • Un equipo cálido, transparente y solidario, con un gran énfasis en el equilibrio entre la vida laboral y personal. 
  • La oportunidad de dejar su huella en la e-salud y la IA.

Acerca de IOMED

IOMED es una empresa líder en tecnología en el campo de la extracción y procesamiento masivo de datos médicos. Está formada por un equipo unido, joven, dinámico y flexible, que, después de varios años de trabajo conjunto, se caracteriza por su agilidad, gusto por el trabajo y la simpatía. Por ello, buscamos candidatos con ganas de innovar, lanzar un proyecto relevante y crecer con él, siempre disfrutando del trabajo en equipo y de los retos, que son muchos, cada día.

Como empleador, ofrecemos igualdad de oportunidades. Queremos hacer crecer nuestro equipo con personas talentosas y dinámicas que quieran dejar su huella en el campo de la IA y la investigación, independientemente de su raza, color, religión,  origen nacional, género, discapacidad física o edad.

Qué hacemos

Hoy en día, todavía hay grandes dificultades para acceder a los datos del mundo real (Real-World Data), que son aquellos que se encuentran en las historias clínicas electrónicas (EHR), debido a que hasta el 85% de los datos clínicos existentes no están estructurados. Esto supone una pérdida de oportunidades para que el sector mejore sus procesos sanitarios y la investigación clínica.

IOMED ha desarrollado una solución de procesamiento de lenguaje natural (NLP) que extrae y transforma los datos clínicos en un modelo internacional y federado, OMOP CDM, dando como resultado una base de datos estructurada, estandarizada e interoperable que contiene información clínica completa de los hospitales.

De este modo, los profesionales y la industria pueden hacer uso de estos datos y obtener evidencias basadas en todos los datos, Real World Evidence, que tiene un valor esencial a la hora de tomar decisiones, entre otros. Todo esto, además, para garantizar la protección y la gobernanza de los datos en todo momento.