Witamy w repozytorium z zadaniami II Olimpiady Sztucznej Inteligencji. Olimpiada ta jest skierowana do uczniów w Polsce, zarówno ze szkół średnich jak i podstawowych, którzy są zainteresowani sztuczną inteligencją. Celem jest zwiększenie zainteresowania AI i wyłonienie składów reprezentacji na olimpiady międzynarodowe IOAI w Pekinie (2-9 sierpnia 2025) i IAIO w Lublanie.
Strona główna: Olimpiada Sztucznej Inteligencji
Druga edycja Olimpiady odbędzie się w trzech etapach:
- Pierwszy etap, online, 17.02 - 22.03.2025.
- Drugi etap, regionalny w 4 miastach: Kraków, Poznań, Warszawa i Wrocław, 26 - 27.04.2025
- Trzeci etap, finał we Wrocławiu, 30.05 - 02.06.2025.
Regulamin jest dostępny na naszej stronie.
Oficjalnym kanałem komunikacji z uczestnikami będzie platforma Discord. Dostęp do niej otrzymują uczestnicy po dokonaniu rejestracji.
W ramach pierwszego etapu Olimpiady uczestnicy zmierzą się z następującymi wyzwaniami:
- Maszynka do Liczenia Monet - Detekcja monet z wykorzystaniem modeli wizyjnych.
- Wykrywanie Halucynacji - Wykrywanie halucynacji modeli językowych w odpowiedziach na pytania.
- Wykrywanie Zaburzeń Sygnału EKG - Wykrywanie anomalii w danych EKG.
- Zaszumienie w Etykietach Danych - Trenowanie modeli z zaszumionymi etykietami.
- Ukryte Podciągi - Identyfikacja zależności w binarnych ciągach znaków.
W drugim etapie uczestnicy rywalizowali rozwiązując nastepujące zadania:
- Rozkład Nienormalny - Usuwanie i klasyfikacja różnych rodzajów szumu na obrazie.
- Kredytobranie - Znajdowanie kierunków w przestrzeni danych najskuteczniej zmieniających decyzje klasyfikatora.
- Ekstrakcja Źródeł - Dobór embeddingów użytecznych w wyszukiwaniu tekstów źródłowych.
W pierwszym etapie uczestnicy rozwiązywali zadania samodzielnie i przesyłali je do Komitetu Merytorycznego za pomocą Platformy Konkursowej. Dostęp do niej jest udostępniany uczestnikom po rejestracji. Każde zadanie wymagało przesłania pliku Jupyter Notebook z rozwiązaniem. Wszystkie prace zostały oceniane automatycznie na Platformie Konkursowej.
Lista dopuszczalnych pakietów znajduje się w pliku environment.yml
, osobno dla każdego zadania. Rozwiązania były testowane przy użyciu Pythona 3.11. Na potrzeby pracy nad zadaniami, zalecamy wykorzystanie środowiska online Google Colab. lub stworzenie środowiska lokalnego z wykorzystaniem Anacondy (instrukcję instalacji środowiska z pliku YML znajdziesz tutaj).
Uwaga: To samo rozwiązanie uruchomione w środowisku lokalnym lub Google Colab może zwracać inne wyniki niż na Platformie Konkursowej. Ostateczna ocena Twojego zadania zostanie wyliczona na Platformie Konkursowej.
Oceny za zadania zostaną wyliczone na podstawie podanych w treściach zadań kryteriów. Za każde zadanie w pierwszym etapie uczestnicy mogą zdobyć maksymalnie 100 punktów.
Repozytorium korzysta z następujących zasobów objętych licencjami:
- ChatGPT - obrazy w zadaniach 2, 3 i 5, pytania ze zbioru danych w zadaniu 2.
- OpenArt.ai - obraz w zadaniu 4.
- Flux - obraz w zadaniu 1.
- Gemma - odpowiedzi na pytania ze zbioru danych w zadaniu 2.
- Google Gemini - zbiór danych w zadaniu 3, który następnie uległ modyfikacjom.
- MedMNIST - zbiór danych w zadaniu 4, który następnie uległ modyfikacjom.
- ChatGPT - obrazy w zadaniach.
- SGPT-125M - Model użyty w zadaniu Ekstrakcja Źródeł.
- SciFact - Zbiór danych użyty w zadaniu Ekstrakcja Źródeł. Zbiór został zmodyfikowany poprzez wybranie podzbioru zdań oraz odrzucenie dodatkowych anotacji jeśli występowała więcej niż jedna. Korpusy pochodzą ze zbioru S2ORC.
@article{muennighoff2022sgpt,
title={SGPT: GPT Sentence Embeddings for Semantic Search},
author={Muennighoff, Niklas},
journal={arXiv preprint arXiv:2202.08904},
year={2022}
}
@inproceedings{Wadden2020FactOF,
title={Fact or Fiction: Verifying Scientific Claims},
author={David Wadden and Shanchuan Lin and Kyle Lo and Lucy Lu Wang and Madeleine van Zuylen and Arman Cohan and Hannaneh Hajishirzi},
booktitle={EMNLP},
year={2020},
}
@inproceedings{lo-wang-2020-s2orc,
title = "{S}2{ORC}: The Semantic Scholar Open Research Corpus",
author = "Lo, Kyle and Wang, Lucy Lu and Neumann, Mark and Kinney, Rodney and Weld, Daniel",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.447",
doi = "10.18653/v1/2020.acl-main.447",
pages = "4969--4983"
}
W razie pytań lub wątpliwości, prosimy o kontakt przez platformę Discord lub e-mail: oai@cs.uni.wroc.pl.
Życzymy powodzenia w rozwiązywaniu zadań!