Využití otevřených dat pro modelování materiálů s pomocí strojového učení
Téma již má řešitele.- Řešitel
- Šimon Kratochvíl - Gymnázium Brno-Řečkovice, příspěvková organizace
- Instituce
- Masarykova univerzita
- Fakulta/ústav
- Fakulta přírodovědecká
- Další údaje o pracovišti
- Ústav fyziky a technologií plazmatu
- Lektoři
- Pavel Ondračka
- Podpora
- JCMM podpořila toto SOČ téma částkou 0 Kč na materiál a částkou 10 000 Kč na honorář školitele.
Metody strojového učení se těší rostoucí popularitě při high-throughput výpočtech materiálových vlastností a předpovědích nových materiálů. Většina takových výzkumů nicméně trénuje modely na vlastních datech a nebo na uzavřených databázích, jako je například Materials Archive. S rostoucím důrazem na Open Science praktiky je nicméně k dispozici násobně větší množství uživatelských dat generovaných původně pro jiné účely než strojové učení, které jsou dostupné v otevřených repozitářích. Právě otevřenost repozitářů ale vede k tomu, že zde není žádná garance kvality dat, například konvergence vzhledem k numerickým parametrům, a také není zcela jasná kompatibilita mezi výsledky z různých implementací. Cílem této práce bude zhodnotit možnosti použití strojového učení na datech z otevřených archivů materiálových výpočtů, jako je například NOMAD Archive, konkrétně vytvoření vhodného protokolu pro detekci a odfiltrování nekvalitních dat, trénink jednoduchého vzorového strojově učeného interatomárního potenciálu a jeho otestování.