Regex — це потужний, але забутий інструмент для пошуку й аналізу даних.
За допомогою лише одного рядка ви можете автоматизувати те, що інакше потребувало б десятків рядків коду.
Скорочення від «регулярного виразу», регулярний вираз — це послідовність символів, яка використовується для визначення шаблону для відповідного тексту.
Це те, що дозволяє вам з точністю знаходити, витягувати або замінювати певні рядки даних.
У пошуковій пошуковій системі регулярний вираз допомагає ефективно отримувати та фільтрувати інформацію – від аналізу варіантів ключових слів до очищення брудних даних запиту.
Але його цінність виходить далеко за межі SEO.
Регулярні вирази також є фундаментальними для обробки природної мови (NLP), пропонуючи зрозуміти, як машини читають, аналізують і обробляють текст – навіть те, як великі мовні моделі (LLM) токенізують мову за лаштунками.
Regex використовується в пошукових системах SEO та AI
Перш ніж розпочати роботу з основами регулярного виразу, я хочу висвітлити деякі з його використання в наших щоденних робочих процесах.
Google Search Console має функцію фільтра регулярних виразів для ізоляції конкретних типів запитів.
Одним із найпростіших регулярних виразів, які зазвичай використовуються, є регулярний вираз бренду brandname1|brandname2|brandname3що дуже корисно, коли користувачі пишуть назву вашого бренду різними способами.


Google Analytics також підтримує регулярні вирази для визначення фільтрів, ключових подій, сегментів, аудиторій і груп вмісту.
Looker Studio дозволяє використовувати регулярні вирази для створення фільтрів, обчислюваних полів і правил перевірки.
Screaming Frog підтримує використання регулярного виразу для фільтрації та вилучення даних під час сканування, а також для виключення певних URL-адрес із вашого сканування.


Google Таблиці дозволяють перевірити, чи відповідає клітинка певному регулярному виразу. Просто використовуйте функцію REGEXMATCH (текст, регулярний_вираз).
У SEO ми оточені інструментами та функціями, які просто чекають добре написаного регулярного виразу, щоб повністю розкрити свій потенціал.
Regex в НЛП
Якщо ви створюєте інструменти SEO, особливо ті, які передбачають обробку вмісту, регулярні вирази є вашою секретною зброєю.
Це дає вам можливість шукати, перевіряти та замінювати текст на основі вдосконалених настроюваних шаблонів.
Ось блокнот Google Colab із прикладом сценарію Python, який приймає список запитів і витягує різні варіанти назви мого бренду.
Ви можете легко налаштувати цей код, підключивши його до ChatGPT або Claude поруч із назвою свого бренду.


Отримайте пошукову розсилку, на яку покладаються маркетологи.
Як написати регулярний вираз
Я прихильник Vibe-кодування, але не такого, де ви пропускаєте основи й повністю покладаєтеся на магістра.
Зрештою, ви не можете правильно користуватися калькулятором, якщо не розумієте чисел або принципів додавання, множення, ділення та віднімання.
Я підтримую таке кодування Vibe, яке ґрунтується на невеликих знаннях програмування – достатніх для ефективного використання LLM, перевірки того, що вони виробляють, і усунення несправностей, коли це необхідно.
Подібним чином вивчення основ регулярних виразів допоможе вам використовувати LLM для створення складніших виразів.
Проста шпаргалка з регулярними виразами
| символ | Значення |
. | Відповідає будь-якому окремому символу. |
^ | Відповідає початку рядка. |
$ | Збігається з кінцем рядка. |
* | Відповідає 0 або більше попередніх символів. |
+ | Збігається з 1 або декількома попередніми символами. |
? | Робить попередній символ необов’язковим (0 або 1 раз). |
{} | Збігається з попереднім символом певну кількість разів. |
[] | Відповідає будь-якому символу в дужках. |
\ | Екранує спеціальні символи або сигналізує про спеціальні послідовності, наприклад \d. |
` | Відповідає буквальному символу зворотної галочки. |
() | Групує символи разом (для операторів або захоплення). |
Приклад використання
Ось список із 10 довгих ключових слів. Давайте дослідимо, як різні шаблони регулярних виразів фільтрують їх за допомогою інструменту Regex101.
- «Найкращі веганські рецепти для початківців».
- «Доступні сонячні панелі для дому».
- «Як підготуватися до марафону».
- «Електромобілі з найдовшим запасом ходу».
- «Програми для медитації для зняття стресу».
- «Бренди сталої моди для жінок».
- «Домашні тренування своїми руками без обладнання».
- «Страхування подорожей для пригодницьких подорожей».
- «ШІ для написання програмного забезпечення для SEO-контенту».
- «Техніка приготування кави для любителів еспресо».
приклад 1: Витягніть будь-яку послідовність із двох символів, яка починається з «а». Другий символ може бути будь-яким (тобто a, потім будь-яким).
- Регулярний вираз:
a. - Вихід: (Усі виділені слова на скріншоті нижче.)


приклад 2: Витягніть будь-який рядок, який починається з літери «a» (тобто a є початком рядка, а потім іде будь-що).
- Регулярний вираз:
^a. - Вихід: (Усі виділені слова на знімку екрана нижче.)


приклад 3: Витягніть будь-який рядок, який починається з «a» і закінчується на «e» (тобто будь-який рядок, який починається з a, за яким слідує будь-що, а потім закінчується на e).
- Регулярний вираз:
^a.*e$ - Вихід: (Усі виділені слова на скріншоті нижче.)


Приклад 4: Витягніть будь-який рядок, який містить два «s».
- Регулярний вираз:
s{2} - Вихід: (Усі виділені слова на скріншоті нижче.)


Приклад 5: Витягніть будь-який рядок, який містить «for» або «with».
- Регулярний вираз:
for|with - Вихід: (Усі виділені слова на скріншоті нижче.)


Я також створив зразок регулярного виразу Google Sheet, щоб ви також могли пограти, протестувати та випробувати цю функцію в Google Sheets. Перевірте це тут.


Примітка: Клітини в Витягнутий текст Стовпець, у якому показано #N/A, означає, що регулярний вираз не знайшов відповідний шаблон.
Досліджуючи регулярні вирази, ви відкриєте нові можливості для аналізу й упорядкування даних пошуку.
Це одна з тих навичок, завдяки яким ви будете швидшими та точнішими – незалежно від того, сегментуєте ви ключові слова, очищаєте заплутані запити чи налаштовуєте розширені фільтри в Search Console чи Looker Studio.
Коли ви навчитеся основам, почніть шукати, де регулярні вирази можуть заощадити ваш час.
Використовуйте його, щоб ідентифікувати фірмові та небрендовані пошуки, групувати URL-адреси за шаблоном або перевіряти великі текстові набори даних, перш ніж вони потраплять у ваші звіти.
Експериментуйте з різними виразами в таких інструментах, як Regex101 або Google Sheets, щоб побачити, як невеликі зміни синтаксису впливають на результати.
Чим більше ви практикуєтеся, тим легше стає розпізнавати закономірності як у даних, так і у вирішенні проблем.
Ось де регулярний вираз справді заслужить своє місце у вашому наборі інструментів SEO.
Авторів, які вносять свій внесок, запрошують створити вміст для Search Engine Land і обирають за їхній досвід і внесок у пошукову спільноту. Наші дописувачі працюють під наглядом редакції, і внески перевіряються на якість і актуальність для наших читачів. Search Engine Land належить Semrush. Автора не просили прямо чи непрямо згадувати Семруша. Думки, які вони висловлюють, є їхніми власними.
