Využití otevřených dat pro modelování materiálů s pomocí strojového učení

Téma již má řešitele.
Řešitel
Šimon Kratochvíl - Gymnázium Brno-Řečkovice, příspěvková organizace
Instituce
Masarykova univerzita
Fakulta/ústav
Fakulta přírodovědecká
Další údaje o pracovišti
Ústav fyziky a technologií plazmatu
Lektoři
Pavel Ondračka
Podpora
JCMM podpořila toto SOČ téma částkou 0 Kč na materiál a částkou 10 000 Kč na honorář školitele.

Metody strojového učení se těší rostoucí popularitě při high-throughput výpočtech materiálových vlastností a předpovědích nových materiálů. Většina takových výzkumů nicméně trénuje modely na vlastních datech a nebo na uzavřených databázích, jako je například Materials Archive. S rostoucím důrazem na Open Science praktiky je nicméně k dispozici násobně větší množství uživatelských dat generovaných původně pro jiné účely než strojové učení, které jsou dostupné v otevřených repozitářích. Právě otevřenost repozitářů ale vede k tomu, že zde není žádná garance kvality dat, například konvergence vzhledem k numerickým parametrům, a také není zcela jasná kompatibilita mezi výsledky z různých implementací. Cílem této práce bude zhodnotit možnosti použití strojového učení na datech z otevřených archivů materiálových výpočtů, jako je například NOMAD Archive, konkrétně vytvoření vhodného protokolu pro detekci a odfiltrování nekvalitních dat, trénink jednoduchého vzorového strojově učeného interatomárního potenciálu a jeho otestování.