Global Annotation Manager & développeuse TAL chez Weborama
Juin 2017 - Aujourd'hui
Au sein de Weborama, entreprise spécialisée dans la création de segments d'audiences en ligne, je m'occupe tout d'abord de gérer le lexique multilingue permettant d'analyser des pages Web. Je recrute et gère donc des annotateurs freelance souvent multilingues qui complètent lexique et taxonomies thématiques.
Je développe, par ailleurs, au sein et en complément de la chaine de TAL, des preuves de concepts et des modules permettant d'exploiter ces données ou de tester de nouvelles approches afin d'améliorer l'analyse automatique des pages web.
Enfin, j'appuie également les membres des Business Units dans la mise au point de corpora répondant à des recherches précises demandées par les clients en établissant sur nos interfaces des requêtes pertinentes permettant de récupérer du contenu web. Celui-ci sera traité grâce aux outils de TAL. Cette tâche s'étend aussi à des formations sur notre outil de visualisation et d'analyse contextuelle de ces contenus web.
Outils et technologies employés : MySQL, Linux, Java, Python, Neo4j/Cypher.
Ingénieure d'études chez Huma-Num - Interopérabilité des données, référentiels et conception d’applications.
Novembre 2015 - Juin 2017
La Très Grande Infrastructure de Recherche (TGIR) Huma-Num est portée par une Unité Mixte de Services associant le CNRS, l'Université d'Aix-Marseille et le Campus Condorcet.
Maintenance des vocabulaires utilisés pour enrichir la plateforme Isidore.
Développement d'applications web et de traitements autour de ces vocabulaires et plus généralement de l'interface Isidore.
Outils et technologies employés : PHP, HTML, MySQL, PhpMyAdmin, Linux, Skos/RDF, XML, XSL.
Stage Ingénieure Traitement Automatique du Langage chez Trooclick
Mars 2015 - Septembre 2015
Maintenance et développement des chaînes NooJ (grammaires et dictionnaires) permettant l'extraction d'Entités Nommées dans de la presse anglophone. Développement d'une grammaire et d'une liste de référence reconnaissant les produits commerciaux.
Outils et technologies utilisés : Python, NooJ, SPARQL, DBpedia.
Stage Linguiste Informaticienne chez Semantiweb
Mai 2014 - Septembre 2014
Maintenance et création des ressources linguistiques destinées à l'établissement de l'e-réputation des entreprises clientes, basée sur du "discours spontané" : forums, commentaires sur sites commerciaux, etc.
Outils et technologies utilisés : Python, Linux, Java, SolR.
20h
Transcription de documents audio de tous types (discours politiques, histoires lues, dictées, etc.). Lancement de scripts Praat pour une segmentation (phrases, mots, syllables) et vérification des résultats.
Outils et technologies utilisés : Praat.
Stage Chargée de veille numérique et communication digitale chez Tendances Institut
Mai 2013 - Août 2013
Veille numérique et rédaction de notes pour les entreprises clientes. Rédaction d'articles d'actualité pour le blog de la société.
Outils et technologies utilisés : Google Actu, WordPress, Microsoft Office.