BigKnowledge for Text Mining.

Deskribapen motza (eu): 
Ikasketa sakona, Big Data eta ezagutzaren kudeaketa eleanitza.

BigKnowledge proiektuak ingeles, gaztelania, katalan, euskara eta galizierazko testuak prozesatzeko ikasketa sakonean oinarritutako sistemak garatu eta ebaluatuko ditu, Big Data prozesatzeko teknikak erabiliz.

Hauek dira proiektuaren helburu nagusiak:
- Transferitzia bidezko ikasketa teknikak garatzea, errepresentazio jarraitu eleaniztunen bidez ezagumendua
hizkuntza batetik bestera pasatzkeo, edo domeinu batetik bestera pasatzeko.
- Tamaina handiko ezagutza-base eleaniztunak eta neurona-sare sakonak aprobetxatzea
elkar aberastu eta hobetzeko.

Deskribapen motza (en): 
Deep learning, Big Data and knowledge for multilingual text processing.
Deskribapena (en): 

BigKnowledge will develop and assess deep learning systems to process texts in English,
Spanish, Catalan, Basque and Galician using Big Data processing techniques to provide the
required information in a timely manner.

The main objectives of the project are:
- To develop a transfer-learning resource for deriving cross-lingual embeddings and
projecting knowledge from languages to languages or from one language in a
particular domain to new domains and genres.
- To leverage both large-scale multilingual knowledge bases and new deep neural
network techniques to enrich and improve each other.

Deskribapen motza (es): 
Aprendizaje profundo, Big Data y conocimiento para el procesamiento de texto multilingüe.
Deskribapena (es): 

BigKnowledge desarrolla y evaluá sistemas de aprendizaje profundo para procesar textos en inglés,
español, catalán, vasco y gallego utilizando técnicas de procesamiento de Big Data para proporcionar la
información requerida de manera oportuna.

Los objetivos principales del proyecto son:
- Desarrollar técnicas de transferencia de aprendizaje para derivar representaciones continuas multilingües y
proyectar conocimiento de un idioma a otro, o de un
dominio particular a nuevos dominios y géneros.
- Aprovechar tanto las bases de conocimiento multilingües a gran escala como las redes neuronales profundas
para que se enriquezcan y mejoren mutuamente.

Ikertzaile nagusia: 
Eneko Agirre
Erakundea: 
BBVA
Hasiera data: 
2019/04/30
Bukaera data: 
2021/04/30
Taldeko ikertzaile nagusia: 
Eneko Agirre
Kontratua: 
No
HiTZ