КОНТАКТ
ул. „Руѓер Бошковиќ“ бр. 18 П. фах 574 – Скопје,
[email protected]
(02) 3099 191 и (02) 3062 224
Back

Претпроцесирање на податоци и подготовка за машинско учење

Искористете го целосниот потенцијал на вашите податоци! Овој курс ги учи клучните техники за подготовка и трансформација на податоци за машинско учење, користејќи Python за чистење, визуелизација и оптимизација на податоците за подобра точност и перформанси на моделите.

Преглед на курсот
Поглавје Детали
Партнер Факултет за електротехника и информациски технологии
Наслов Претпроцесирање на податоци и подготовка за машинско учење
Услуга Курс
Целна група Инженери и IT професионалци од МСП, индустрија и јавни организации, како и други лица кои сакаат да развијат вештини во претпроцесирање и подготовка на податоци за машинско учење
Формат Настава во живо
Фокус на клучни технологии Наука за податоци, вештачка интелигенција
Статус Подготвен за понуда
Засегнати страни од МСП/ЈА Организации кои имаат потреба од квалитетна подготовка на податоци за подобро донесување на одлуки и развој на решенија базирани на машинско учење
Барања за учество Основно познавање од анализа на податоци, не е задолжително претходно искуство за работа во Python
Проценето времетраење  16 часа
Опис на курсот

Претпроцесирањето и подготовката на податоците претставуваат суштински чекори во процесот на машинското учење. Станува збор за трансформација на необработени (сирови) податоци во структурирана и конзистентна форма, со цел да се овозможи нивна ефикасна употреба од страна на алгоритмите за машинско учење. Целта на овој процес е да се обезбедат точни, комплетни и усогласени податоци, што директно влијае врз стабилноста и интерпретацијата на моделите, како и врз нивната способност за предвидување.

Овој курс нуди практичен пристап кон целосно искористување на потенцијалот на податоците, преку совладување на клучни техники за нивно прочистување, визуелизација, трансформација и зголемување – процеси кои се од суштинско значење за развој на ефикасни модели на машинско учење. Со употреба на програмскиот јазик Python и библиотеки како Pandas, NumPy и Matplotlib, учесниците ќе стекнат вештини за решавање на предизвици од реалниот свет, како: интеграција на податоци од различни извори, справување со странични вредности и вредности кои недостасуваат, визуелизација на дистрибуцијата на карактеристиките и нивната корелација, нормализирање на податоците, генерирање на дополнителни податоци кај небалансирани податочни множества – со што ќе се обезбеди точност, релевантност и подготвеност на податоците за развој на модели за машинско учење.

Курсот е структуриран во четири дена, секој со фокус на специфичен сегмент од процесот на подготовка и претпроцесирање на податоците:

  • Поставување на работна околина, вовед во Python и неговите основи, како и основен преглед на концептите поврзани со претпроцесирање и подготовка на податоци. Ќе се опфатат и различните извори на податоци и начини на нивна интеграција.
  • Чистење на податоците, визуелизација и избор на карактеристики, преку практични примери и алатки за анализа.
  • Екстракција и трансформација на карактеристики, како и, доколку има потреба, вовед во основни техники за обработка на сигнали со цел подобрување на квалитетот на податоците.
  • Генерирање на синтетички податоци и техники за зголемување на податочните множества, насочени кон зголемување на варијабилноста и подобрување на перформансите на моделите.

По успешно завршување на курсот, учесниците ќе поседуваат практични знаења и вештини за претпроцесирање и подготовка на податоци, и ќе бидат оспособени да се справат со комплексности кои произлегуваат од реални податочни множества. Стекнатите вештини ќе им овозможат да ги подготват податоците на начин што овозможува нивна директна примена во различни алгоритми за машинско учење, што ќе резултира со повисоки перформанси, подобра предиктивна точност и поголема робустност на моделите.

Дополнителни информации за курсот
Категорија Детали
Стекнати вештини Учесниците ќе стекнат знаења и вештини, вклучувајќи:
Вештина 1: Поставување на работна околина и основно познавање на работа во Python.

Вештина 2: Способност за откривање и корекција на грешки, отстранување на нерелевантни податоци и пополнување на податоци кои недостасуваат.

Вештина 3: Примена на алатки за визуелизација на податоци со цел идентификација на трендови, обрасци и аномалии во податоците.

Вештина 4: Екстракција, идентификација и трансформација на релевантни карактеристики кои влијаат на перформансите на моделот.

Вештина 5: Примена на техники за зголемување на разновидноста и обемот на податоците со цел подобрување на резултатите од моделот.

Методи на учење Предавања, практични вежби, групни дискусии