Вълнуващо пътешествие в света на Изкуствения Интелект и NLP с Hugging Face

Вълнуващо пътешествие в света на Изкуствения Интелект и NLP с Hugging Face

( 3 Отзиви )
лв.985лв.375

Обща Информация

Целева аудитория: Деца над 12 години с интерес към програмиране, езици и изкуствен интелект.

Предварителни знания: Базови познания по програмиране (променли, цикли, функции) – за предпочитане Python.

Цел: Да се запознаят участниците с магията на обработката на естествен език (NLP) и да изградят собствени NLP приложения с помощта на Hugging Face.

Материали:

Структура на курса:

Курсът е разделен на 3 модула, всеки с продължителност 4 седмици. Всеки модул включва:

  • Лекции: (2 часа седмично) – представяне на теоретичните концепции с интерактивни примери, демонстрации и забавни факти.
  • Упражнения: (2 часа седмично) – практически задачи за затвърдяване на наученото, с фокус върху решаване на проблеми и творческо приложение.
  • Проект: (1 проект на модул) – по-голям практически проект, разработен самостоятелно или в екип, с възможност за представяне пред публика.

Модул 1: “Здравей, AI!”: Първи стъпки в NLP (4 седмици)

  • Седмица 1: “Какво е AI?”: Разкриване на магията на AI.
    • Какво е AI и как променя света?
    • Забавни примери за AI в ежедневието.
    • Игри и дейности за разпознаване на езикови модели.
    • Въведение в Python: променливи, типове данни, условни конструкции.
  • Седмица 2: “Говорим с компютри”: Първи стъпки в NLP.
    • Какво е NLP?
    • Приложения на NLP: чатботове, преводачи, анализ на текст.
    • Работа с текст в Python.
    • Проект: Създаване на прост chatbot с предварително зададени отговори.
  • Седмица 3: “Hugging Face – нашият AI помощник”: Запознаване с Hugging Face.
    • Какво е Hugging Face и защо е толкова готин?
    • Инсталиране на Python и необходимите библиотеки.
    • Запознаване с Google Colab.
    • Първи стъпки с Hugging Face Transformers.
  • Седмица 4: “Говорим езика на AI”: Подготовка на данни.
    • Зареждане и преглед на текстови данни.
    • Почистване на текст: премахване на ненужни символи и думи.
    • Токенизация: разделяне на текст на думи или фрази.
    • Проект: Създаване на програма за анализ на честотата на думите в текст.

Модул 2: “AI детектив”: Класификация на текст (4 седмици)

  • Седмица 5: “Разчитане на емоции”: Въведение в класификацията на текст.
    • Какво е класификация на текст?
    • Примери: анализ на чувства, разпознаване на спам.
    • Данни за класификация на текст.
    • Въведение в машинно обучение: основни концепции.
  • Седмица 6: “BERT – супергероят в класификацията”: Използване на BERT.
    • Какво са невронни мрежи и как “мислят”?
    • Трансформър архитектура: разгадаване на тайната.
    • BERT: как “разбира” текст?
    • Проект: Използване на BERT за класификация на настроения.
  • Седмица 7: “Тренировка на AI детектив”: Фина настройка на модели.
    • Трансфер обучение: предаване на знания от един модел на друг.
    • Фина настройка на BERT с Hugging Face Trainer: обучение за конкретна задача.
    • Оценка на модели: колко е “умен” нашият AI детектив?
  • Седмица 8: “Създаване на AI детективско приложение”: Практически проект.
    • Проект: Създаване на приложение за анализ на чувства в текст (напр. разпознаване на позитивни, негативни или неутрални коментари).

Модул 3: “AI разказвач”: Генериране на текст (4 седмици)

  • Седмица 9: “От думи към истории”: Въведение в генерирането на текст.
    • Какво е генериране на текст?
    • Примери: писане на истории, превод, създаване на диалози.
    • Данни за генериране на текст.
    • GPT модели: магичните разказвачи на AI.
  • Седмица 10: “GPT – майсторът на историите”: Използване на GPT модели.
    • Как GPT “пише” текст?
    • Фина настройка на GPT-2 с Hugging Face Trainer: обучение за творческо писане.
    • Beam Search декодиране: намиране на най- “интересните” истории.
  • Седмица 11: “Развиване на творческия потенциал на AI”: Разширени техники.
    • Контролирано генериране: указване на тема, стил или ключови думи.
    • Temperature sampling: контролиране на “креативността” на AI.
    • Етични съображения при генериране на текст.
  • Седмица 12: “AI разказвач в действие”: Финален проект.
    • Проект: Създаване на приложение за генериране на текст (напр. писане на кратки истории, стихотворения, диалози).

Допълнителни дейности

  • Седмични предизвикателства и забавни игри, свързани с AI и NLP.
  • Дискусии за етичното използване на AI технологии.
  • Гост-лектори от индустрията (виртуално или на живо).
  • Редовни сесии за въпроси и отговори.
  • Онлайн ресурси и материали за допълнително обучение.

Оценяване:

  • Активно участие в час.
  • Решаване на упражненията.
  • Разработка на проектите с фокус върху креативност, иновативност и екипна работа.

I. Основи на изкуствения интелект и обработката на естествен език:

  • Разпознаване на концепции:
    • Дефиниране на изкуствен интелект (AI) и описване на неговите ключови характеристики.
    • Разбиране на разликата между тесен (Narrow AI) и общ изкуствен интелект (General AI).
    • Дефиниране на обработка на естествен език (NLP) и нейните под-области.
    • Идентифициране на приложения на AI и NLP в различни сфери на живота.
  • Разбиране на основни принципи:
    • Обясняване на значението на данните в AI и NLP.
    • Разбиране на разликата между обучение с учител (supervised learning) и обучение без учител (unsupervised learning).
    • Обясняване на концепцията за невронни мрежи и тяхната роля в NLP.

II. Програмиране с Python за NLP:

  • Базови езикови концепции:
    • Работа с променливи, типове данни, оператори и изрази в Python.
    • Използване на условни конструкции (if, else, elif) и цикли (for, while).
    • Дефиниране и извикване на функции.
  • Работа с текст в Python:
    • Четене и запис на текстови файлове.
    • Манипулиране на низове: търсене, замяна, форматиране.
    • Работа с регулярни изрази за по- сложни текстови операции.

III. Библиотеката Hugging Face за NLP:

  • Основни компоненти:
    • Обясняване на ролята на Hugging Face в екосистемата на NLP.
    • Навигиране в Hugging Face Model Hub и намиране на подходящи модели.
    • Използване на Hugging Face Pipelines за бързо прототипиране и експериментиране.
    • Работа с Hugging Face Datasets за зареждане и предобработка на данни.
  • Работа с трансформър модели:
    • Разбиране на архитектурата на трансформър моделите и тяхното предимство пред традиционните невронни мрежи.
    • Обясняване на концепцията за трансфер обучение и нейното приложение в NLP.
    • Използване на предварително обучени трансформър модели (BERT, GPT) за различни NLP задачи.

IV. NLP задачи и техники:

  • Класификация на текст:
    • Дефиниране на класификация на текст и нейните приложения.
    • Подготовка на данни за класификация на текст.
    • Фина настройка на трансформър модели за класификация на текст.
    • Оценка на модели за класификация с помощта на метрики като точност, прецизност и припомняне.
  • Генериране на текст:
    • Дефиниране на генериране на текст и нейните приложения.
    • Подготовка на данни за генериране на текст.
    • Фина настройка на трансформър модели за генериране на текст.
    • Използване на техники за декодиране като Beam Search за генериране на по- качествени текстове.
  • Други NLP задачи:
    • Запознаване с други NLP задачи като разпознаване на наречени обекти (Named Entity Recognition), семантичен анализ, обобщаване на текст.

V. Етични аспекти на AI и NLP:

  • Разпознаване на етични проблеми:
    • Осъзнаване на потенциални пристрастия в данните и моделите.
    • Разбиране на ефекта от AI и NLP върху заетостта и обществото.
    • Осъзнаване на значението на прозрачността и отговорността при разработването и използването на AI системи.

I. Програмиране с Python за NLP:

  • Написване на Python код за:
    • Четене, записване и манипулиране на текстови данни.
    • Имплементиране на основни алгоритми за обработка на текст (напр. търсене на ключови думи, броене на честота на думи).
    • Създаване на прости чатботове с предопределени отговори.
  • Използване на интегрирани среди за разработка (IDE):
    • Работа с Google Colab за облачно програмиране.
    • Настройка и използване на Jupyter Notebook за интерактивно програмиране.

II. Работа с Hugging Face:

  • Навигиране в екосистемата на Hugging Face:
    • Търсене и избиране на подходящи модели от Hugging Face Model Hub.
    • Зареждане и използване на предварително обучени модели за различни NLP задачи.
    • Работа с Hugging Face Datasets за зареждане и предобработка на данни.
  • Използване на Hugging Face Pipelines:
    • Бързо прототипиране и експериментиране с различни NLP модели и задачи.
    • Изграждане на прости NLP приложения с помощта на Pipelines.

III. Предобработка на текстови данни:

  • Прилагане на техники за почистване на текст:
    • Премахване на специални символи, HTML тагове и други ненужни елементи.
    • Преобразуване на текст в малки букви (lowercase) или главни букви (uppercase).
    • Нормализиране на текст чрез премахване на диалектни особености.
  • Извършване на токенизация на текст:
    • Разделяне на текст на думи (word tokenization) или фрази (subword tokenization).
    • Използване на различни токенизатори от Hugging Face.
  • Прилагане на стеминг и лематизация:
    • Свеждане на думите до тяхната основна форма (stem/lemma) за подобряване на ефективността на моделите.

IV. Фина настройка на трансформър модели:

  • Подготовка на данни за обучение:
    • Разделяне на данните на обучителна, валидационна и тестова множества.
    • Форматиране на данните в подходящ формат за Hugging Face Trainer.
  • Фина настройка на модели с Hugging Face Trainer:
    • Дефиниране на модела, хиперпараметрите и обучителния процес.
    • Стартиране на обучението и проследяване на прогреса.
    • Запазване на обучения модел за по-нататъшна употреба.

V. Оценка и подобряване на модели:

  • Изчисляване на метрики за оценка:
    • Използване на метрики като точност, прецизност, припомняне и F1-резултат за оценка на производителността на моделите.
    • Анализ на грешките на модела и идентифициране на области за подобряване.
  • Прилагане на техники за подобряване на модели:
    • Експериментиране с различни хиперпараметри.
    • Използване на техники за регуларизация за предотвратяване на преобучение.
    • Събиране на повече данни или генериране на синтетични данни.

VI. Изграждане на NLP приложения:

  • Създаване на прости NLP приложения с Python и Hugging Face:
    • Интегриране на обучени модели в приложения за класификация на текст, генериране на текст, чатботове и др.
    • Използване на библиотеки за създаване на потребителски интерфейс (GUI) за NLP приложения.

VII. Работа в екип и представяне на резултати:

  • Съвместна работа по проекти с използване на Git и GitHub.
  • Представяне на проекти и резултати пред публика чрез презентации и демонстрации.

I. Учене и решаване на проблеми:

  • Самостоятелно учене: Развиване на умения за търсене, анализиране и усвояване на информация от различни източници (документация, онлайн ресурси, форуми).
  • Разбиване на сложни проблеми: Умение за разделяне на големи задачи на по- малки, управляеми стъпки.
  • Отстраняване на грешки (debugging): Развиване на логическо мислене и умения за идентифициране и коригиране на грешки в кода.
  • Аналитично мислене: Умение за анализиране на данни, резултати от модели и идентифициране на тенденции и закономерности.

II. Организация и управление на времето:

  • Планиране на проекти: Разпределяне на време и ресурси за ефективно управление на проекти.
  • Поставяне на приоритети: Определяне на най- важните задачи и фокусиране върху тяхното своевременно изпълнение.
  • Работа под напрежение: Умение за запазване на спокойствие и ефективност при работа с крайни срокове.

III. Комуникация и работа в екип:

  • Ефективна комуникация: Умение за ясно и кратко предаване на идеи, проблеми и решения, както устно, така и писмено.
  • Сътрудничество: Работа в екип за постигане на обща цел, разпределяне на задачи и споделяне на знания.
  • Конструктивна критика: Даване и приемане на обратна връзка по позитивен и градивен начин.
  • Представяне пред публика: Умение за уверено и ангажиращо представяне на идеи и резултати пред публика.

IV. Любопитство и креативност:

  • Задаване на въпроси: Развиване на критично мислене и желание за задълбочаване на знанията.
  • Експериментиране: Не се страхувайте да експериментирате с различни подходи, техники и инструменти.
  • Търсене на иновативни решения: Развиване на умения за креативно мислене и намиране на нови и интересни приложения на NLP.

V. Упоритост и мотивация:

  • Поставяне на цели: Дефиниране на лични и професионални цели в областта на AI и NLP.
  • Постоянство: Не се отказвайте при затруднения, а търсете решения и продължавайте напред.
  • Мотивация за развитие: Желание за непрекъснато усъвършенстване на уменията и знанията в динамичната област на AI и NLP.
Модул 1

Въведение в AI и NLP (Седмици 1-4)


Този модул запознава учениците с основите на Изкуствения Интелект и Обработката на Естествен Език. Участниците ще научат какво представляват AI и NLP, ще разберат тяхното значение и приложения в реалния свят. Модулът включва въведение в програмирането с Python, фокусирайки се върху работата с текстови данни. Учениците ще се запознаят с платформата Hugging Face, ще научат как да инсталират необходимите инструменти и ще направят първите си стъпки в обработката на естествен език. Модулът завършва с основни техники за предварителна обработка на текст и проект за анализ на честотата на думите.

Модул 2

Машинно обучение и класификация на текст (Седмици 5-8)


Вторият модул навлиза в дълбочина в машинното обучение и невронните мрежи, с фокус върху тяхното приложение в NLP. Учениците ще се запознаят с концепцията за трансферно обучение и ще научат как да използват предварително обучени модели за различни NLP задачи. Основен акцент в този модул е класификацията на текст, където участниците ще научат как да обучават и оценяват модели за задачи като анализ на настроения и разпознаване на спам. Модулът завършва с разглеждане на различни техники за оценка и подобряване на NLP моделите.

Модул 3

Генериране на текст и напреднали NLP техники (Седмици 9-12)


Последният модул се фокусира върху по-напреднали теми в NLP, започвайки с генерирането на текст. Учениците ще се запознаят с генеративни езикови модели и ще научат как да ги използват за създаване на творческо съдържание. Модулът включва също така работа с многоезикови модели и основи на машинния превод. Участниците ще се запознаят с технологиите за разпознаване на реч и преобразуване на текст в говор. Курсът завършва с финален проект, където учениците ще имат възможност да приложат всички научени концепции и техники в практическо приложение по техен избор.

Моля, попълнете този формуляр

    Информация за курса
    • ,
    • 3
    • 5 h
    • : 50
    Споделяне в социални мрежи

    Свържете се с нас:

      Свържете се с нас:

      Days
      Hours
      Minutes