Testing AI Like a QA Engineer

Научи как да оценяваш AI & ML модели за достоверност и надеждност със структурирани QA техники

Антон Ангелов

Co-founder @ Automate The Planet

Този уъркшоп запознава участниците с основните принципи при тестването на машинно-обучителни системи и оценката на AI модели от QA перспектива. Чрез интерактивни и практически упражнения ще изследваме:

производителността на машинно-обучени класификационни модели,
рисковете, свързани с bias и fairness,
структурирани методи за валидиране на резултатите от генеративни AI модели.

В уъркшопа се използват интуитивни, визуални инструменти, като не се изискват задълбочени програмни умения. Участниците ще проведат и структурирано A/B тестване на водещи езикови модели (например Llama2, Mistral), за да откриват халюцинации, пристрастия и грешки в разсъжденията като по този начин се изгражда мост между традиционния QA и prompt engineering.

Какво ще научиш?

Да разбираш фундаментите на QA при машинно-обучителни и AI системи
Да обучиш и оцениш прост ML класификационен модел с реални данни
Да интерпретираш метрики като accuracy, precision, recall и F1 score
Да идентифицираш как предразсъдъци (bias) в тренировъчните данни може да повлияят върху реални решения (например при одобрение на кредити)
Да проектираш exploratory и метаморфни тестове за AI модели
Да изпълняваш A/B тестване и промпт-базирана валидация на LLM модели (напр. ChatGPT, Mistral, Llama2)
Да прилагаш структурирани QA чек листи за оценка на халюцинации, edge cases и качеството на отговорите, генерирани от AI
Да използваш peer review и рубрик-базирана оценка за тестване на способността на LLM моделите да правят самооценка
Да прилагаш структурирани QA техники, включително принципи, съгласувани с ISTQB, при практическото тестване на AI системи

За да се гарантира персонално внимание и активно участие на всеки, местата са строго ограничени до 40 участници.

За кого е подходящ този Workshop?

QA инженери с малък или нулев опит в AI/ML тестване, които искат да усвоят основите на оценяването на ML модели и LLM чрез достъпни, структурирани техники без писане на код.

QA специалисти, които вече тестват ML или LLM системи, но искат да структурират, стандартизират и надградят подхода си към evaluation процеса.

Team Leads и QA Managers, които планират въвеждане или развитие на QA практики за AI проекти и имат нужда от ясна рамка за качество и надеждност.

Workshop-ът може да е полезен и за:

Програмисти и технически специалисти, които работят по AI функционалности и искат да разберат как се оценява качеството и надеждността на моделите — без да се изисква писане на код по време на workshop-а.
Product Managers, Business Analysts и други роли, ангажирани с AI проекти, които искат практична рамка за оценяване и вземане на информирани решения относно AI решения.

Минимални технически изисквания: базова компютърна грамотност, интерес към AI/ML.

Тулове и настройки, които ще използваме:

• Weka – инструмент с графичен интерфейс за обучение и оценка на ML модели

• Google Teachable Machine – платформа за създаване на класификатори на база изображения и звук

• ChatGPT / Gemini / Claude – за оценка чрез prompt-и и A/B тестване

• VS Code / Markdown Editors – за prompt engineering и писане на рубрики/критерии

• LM Studio (локално)

Подготовка:

Преди уъркшопа участниците ще получат детайлни инструкции как да подготвят всички акаунти и интеграции.

Запази ми място

*За групова отстъпка при покупка на повече от 5 билета, моля свържете се с [email protected]. Груповата отстъпка не важи за билети Early bird. *След като закупите билетите, ще получите допълнителни указания и формуляр за издаване на фактура, ако желаете такава.

Детайли

Формат: Онлайн провеждане в реално време. Уъркшопът е без запис.

Дата: 15 април 2026, от 16:00 до 20:00 ч.

Продължителност: 4 часа

Билети: Единичен онлайн достъп – 127 €. Местата са ограничени до 40. Вземи своя Еarly bird билет сега за 97 € (има само 10).

За лектора

Антон Ангелов

Co-founder @ Automate The Planet

Антон Ангелов е един от най-утвърдените лидери в QA общността в световен мащаб. Той е съосновател, управляващ директор и Chief Test Automation Architect в Automate The Planet – бутикова консултантска компания, специализирана в изграждане на стратегии и мащабируеми решения за автоматизация на тестването.

Създател е на BELLATRIX – съвременен модерен test automation framework за уеб, мобилни, десктоп и API тестове. Автор е на 8 бестселър книги, сред които Design Patterns for High-Quality Automated Tests и поредицата Automated Testing Unleashed. Има над 500 публикувани статии, 100+ образователни видеа за LambdaTest и е изнасял лекции на над 60 международни конференции, включително Selenium Conf, Appium Conf и Heisenbug.

В последните години работи активно в сферата на AI в QA – като създател на AI- базирани инструменти и асистенти за подпомагане на автоматизацията, рецензент на книгата Software Testing with Generative AI от Mark Winteringham и член на Advisory Board – Europe към DEVIES Awards, където оценява иновативни AI решения в реална среда.

Носител е на редица отличия, включително „QA на десетилетието“, „QA на годината“ и е включен в Топ 100 на IT лидерите в България.

Какво казват участниците?

Виж и другите workshop-и

Manual Testing with AI-Powered Workflows

Антон Ангелов

Co-founder @ Automate The Planet

Този уъркшоп запознава участниците с практически подходи за подобряване на ръчните тестове чрез AI агенти/асистенти и MCP-базирана интеграция с инструменти като Jira, Confluence, Zephyr, Slack и GitHub Copilot. Акцентът е върху ефективното извличане на изисквания от документация, изследване на функционалности, логване на дефекти, създаване на структурирани тестови сценарии и репорти чрез шаблони за промптове.

AI Avatars: Създай хипер-реалистична дигитална персона

Петър Стоянов

архитект, 3D артист, основател @ orender.ai

В този интензивен 3-часов уъркшоп ще преминем през целия процес от създаването на аватар до реалното му използване в бизнес среда. Ще видите как се изгражда визуален образ, как се създава и настройва AI глас, как се пише сценарий и как всичко това се комбинира в работещо видео. Ще се научите да използвате платформи и инструменти като HeyGen, Synthesia и Arcads. Ще обсъдим и как да адаптирате съдържанието спрямо различни аудитории - клиенти, екип или обучаеми.

AI-Native Business Analyst

Георги Найденов

Senior AI Business Analyst @ SoftServe

Участниците ще научат как работят големите езикови (LLMs) и визуално-езикови модели (VLMs) и как да ги използват ефективно при реални задачи. Ще разгледаме какви различни артефакти могат да бъдат създавани с помощта на AI, как да се подава правилният контекст към моделите (context engineering) и как тези подходи могат да се прилагат при решаването на конкретни проблеми. В края ще покажем и как AI може да подпомогне дефинирането на обхвата (scoping) на AI и non-AI проекти.