Руководство по LangChain для WhatsApp

Как создать ИИ-агента для WhatsApp на LangChain и Whapi.Cloud: руководство на Python

Updated on June 1, 2026

Это руководство Whapi.Cloud показывает Python-разработчикам, как собрать ИИ-агента для WhatsApp на LangChain и LangGraph с одним размещённым вебхуком. Вы собираете цикл «принять — подумать — ответить», а затем даёте каждому контакту собственную память: для этого thread_id в LangGraph приравнивается к номеру телефона отправителя. Ответы уходят обратно обычным текстом через API Whapi.Cloud — без локального туннеля и без предварительной бизнес-верификации в Meta. Текст рассчитан на бэкенд-разработчиков, которым привычны FastAPI и pip.

Build a WhatsApp AI agent with LangChain, LangGraph and Whapi.Cloud in Python

TL;DR: Запустите цикл «принять — подумать — ответить» на одном вебхуке Whapi.Cloud. Приравняйте thread_id в LangGraph к номеру телефона отправителя и подключите checkpointer — тогда у каждого контакта останется своя память. Возвращайте HTTP 200 меньше чем за секунду, а самого агента запускайте в фоновой задаче. Никакого ngrok, верификации в Meta и шаблонов сообщений. Начните с MemorySaver, а для продакшена замените его на checkpointer на Postgres.

Цикл из трёх шагов, на котором держится любой агент в WhatsApp

ИИ-агент для WhatsApp — это один цикл: принять сообщение, обдумать его агентом с инструментами и отправить ответ. Всё остальное — лишь обвязка вокруг этих трёх шагов.

Цикл «принять — подумать — ответить» для ИИ-агента WhatsApp на одном вебхуке Whapi.Cloud

В этой сборке маршрут FastAPI принимает входящее сообщение от Whapi.Cloud, агент LangGraph на базе ChatOpenAI решает, что делать, а один REST-запрос отправляет ответ обратно. Номер телефона, с которого вам написали, — единственный идентификатор, который нужно протащить через все три шага.

Подключите номер и направьте один вебхук на ваше приложение

Отсканируйте QR-код, чтобы подключить номер, а затем вставьте свой публичный URL в настройки вебхука канала. Входящие сообщения приходят POST-запросами в формате JSON, как только контакт вам пишет.

В официальном WhatsApp Business API пришлось бы зарегистрировать приложение, пройти бизнес-верификацию Meta и выполнить рукопожатие проверки ещё до того, как до вашего кода дойдёт хотя бы одно сообщение. С Whapi.Cloud вы подключаете обычный номер WhatsApp, отсканировав QR-код — тем же способом, что и WhatsApp Web, — и API готов к работе примерно за две минуты. Между вами и первым входящим payload нет очереди на проверку в Meta.

Укажите в качестве URL вебхука маршрут /webhook вашего развёрнутого приложения и подпишитесь на событие messages в настройках канала. После этого Whapi.Cloud отправляет POST-запросом каждое входящее сообщение на этот маршрут. Обработчик FastAPI ниже считывает из payload номер телефона отправителя и текст сообщения.

Настройка URL вебхука и события messages в параметрах канала Whapi.Cloud — Экран настроек канала, где вы вставляете URL вебхука и подписываетесь на событие messages.


# webhook.py -- receives inbound WhatsApp messages from Whapi.Cloud
from fastapi import FastAPI, Request

app = FastAPI()

@app.post("/webhook")
async def webhook(request: Request):
    data = await request.json()
    # Whapi delivers inbound messages in a "messages" array.
    for msg in data.get("messages", []):
        if msg.get("from_me"):
            continue  # skip your own outgoing messages echoed back
        sender = msg["from"]              # the contact's phone number, e.g. "14155551234"
        text = msg.get("text", {}).get("body", "")
        print(f"{sender}: {text}")
    return {"status": "ok"}

Это значение sender — стержень всего агента. Оно говорит, кому отвечать, и уже через минуту станет ключом, который держит каждый разговор отдельно. Полную схему входящего сообщения смотрите в документации API Whapi.Cloud.

Соберите ReAct-агента: он выбирает инструмент, действует и смотрит на результат

ReAct-агент в LangGraph — это LLM, которая выбирает инструмент, запускает его, читает результат и повторяет, пока не сможет ответить. Сам цикл даёт LangGraph; модель и инструменты добавляете вы.

LangChain даёт обёртку для модели и абстракции инструментов. create_react_agent из LangGraph связывает их в граф с состоянием, чтобы агент мог вызвать инструмент, увидеть результат и решить, что делать дальше. Каждую возможность вы описываете обычной функцией с декоратором @tool, а затем передаёте список агенту.


# agent.py -- a tool-using ReAct agent
from langchain_openai import ChatOpenAI
from langchain_core.tools import tool
from langgraph.prebuilt import create_react_agent

# Define tools as standalone functions.
# Decorating a bound method (def check_slots(self, ...)) raises a
# duplicate "self" argument error at agent-build time -- keep tools module-level.
@tool
def check_appointment_slots(day: str) -> str:
    """Return free appointment slots for a given day."""
    return "09:00, 11:30, 16:00"

model = ChatOpenAI(model="gpt-4o", temperature=0)
agent = create_react_agent(
    model,
    tools=[check_appointment_slots],
    prompt="You are a clinic's WhatsApp assistant. Keep replies short.",
)

Аргумент prompt задаёт постоянные инструкции агента и применяется заново на каждом шаге, поэтому роль ассистента остаётся прежней, даже когда разговор разрастается. Держите инструменты маленькими и с одной задачей: один читает свободные слоты для записи, другой ищет заказ, третий передаёт диалог человеку. Модель решает, что вызвать, по имени инструмента и его docstring, поэтому пишите и то, и другое как документацию к API.

Этот агент уже умеет рассуждать и вызывать инструмент. Чего он пока не умеет — это что-либо запоминать. Вызовите его дважды, и второе сообщение начнётся с чистого листа, потому что один вызов ничем не связан со следующим. На практике именно из-за этого пробела большинство первых сборок кажутся сломанными.

Приравняйте thread_id к номеру телефона — и у каждого пользователя будет своя память

Подключите checkpointer и в каждом вызове передавайте thread_id, равный номеру телефона отправителя. Одна эта строка отделяет общий на всех «мозг» от отдельной памяти для каждого контакта.

Память для каждого пользователя: номер телефона как thread_id в LangGraph с checkpointer

Без checkpointer все пользователи делят одно состояние разговора, поэтому второй написавший наследует контекст первого. С checkpointer и отдельным thread_id для каждого пользователя у каждого контакта появляется свой изолированный поток. Возьмите номер телефона из вебхука в качестве этого thread_id — и маршрутизация решится сама собой. Мы называем это правилом «номер вместо thread_id», и на нём держится вся сборка.


# memory.py -- one isolated conversation per phone number
from langgraph.checkpoint.memory import MemorySaver
from langgraph.prebuilt import create_react_agent

checkpointer = MemorySaver()  # in-memory; resets on restart
# For production, swap one line:
# from langgraph.checkpoint.postgres import PostgresSaver
# checkpointer = PostgresSaver.from_conn_string("postgresql://...")

agent = create_react_agent(model, tools=tools, checkpointer=checkpointer)

def reply_for(sender: str, text: str) -> str:
    # thread_id = phone number -> each contact keeps a separate conversation
    config = {"configurable": {"thread_id": sender}}
    result = agent.invoke({"messages": [("user", text)]}, config=config)
    return result["messages"][-1].content

MemorySaver хранит каждый поток в памяти и идеально подходит для прототипа. При перезапуске он всё забывает — и это не проблема, пока дело не дошло до деплоя. Правило «номер вместо thread_id» не меняется при переходе в продакшен; меняется только хранилище за checkpointer. Открытые WhatsApp-агенты, которые работают в продакшене, используют ровно этот подход с привязкой к номеру телефона.

Почему связка «ngrok плюс Business API» ломается первой

Привычный путь из туториалов тянет за собой локальный туннель, шаблоны сообщений и 24-часовое окно для ответа ещё до того, как заработает хоть какая-то логика ИИ. Путь с одним вебхуком обходит все три.

Скорее всего, сначала вы возьмёте стандартную схему: туннель ngrok, чтобы Meta могла достучаться до вашего ноутбука, плюс официальный Business API для отправки. И вот где именно она ломается. URL туннеля меняется при каждом перезапуске и обрывается без предупреждения, поэтому вебхук тихо перестаёт принимать сообщения, хотя код выглядит исправным. А дальше своё трение добавляет сторона отправки.

В официальном WhatsApp Business API любое сообщение, которое вы начинаете вне 24-часового окна, должно быть заранее одобренным шаблоном, и примерно один шаблон из трёх отклоняют при первой проверке из-за формата или категории. С 1 июля 2025 года Meta вдобавок берёт плату за каждое доставленное шаблонное сообщение по тарифу, зависящему от категории и страны, — модель с целым рядом скрытых расходов для разработчиков. С Whapi.Cloud агент отвечает обычным текстом через один вызов API, поэтому нет ни очереди на одобрение шаблонов, ни поштучной оплаты, за которой нужно следить. Вот и весь аргумент о предсказуемости расходов в одной фразе: ответ, который можно отправить свободно, нельзя ни отклонить, ни обложить доплатой.

Что нужно для сборки	Один вебхук Whapi.Cloud	ngrok + официальный Business API
Приём сообщений локально	Размещённый URL вебхука, без туннеля	Туннель ngrok: меняет URL и обрывается
Настройка аккаунта	Скан QR-кода, готово за ~2 минуты	Бизнес-верификация Meta: от дней до недель
Отправка ответа	Свободный текст, один REST-запрос	Заранее одобренный шаблон, ~1 из 3 отклоняют
Сроки ответа	Нет 24-часового сервисного окна	Свободный текст только внутри 24-часового окна
Модель оплаты отправки	Подписка, без платы за шаблон по сообщениям	Оплата за доставленный шаблон с июля 2025

Быстро верните 200, а агента запускайте в фоне

Сразу подтвердите вебхук статусом HTTP 200, а медленный вызов LLM запускайте в фоновой задаче. Медленный ответ ни в коем случае не должен держать соединение вебхука открытым.

Быстрое подтверждение HTTP 200 и фоновая обработка агентом для вебхука WhatsApp

Подпишитесь только на событие messages в настройках канала, чтобы маршрут не будили статусы доставки и отметки о прочтении. Каждый входящий payload вебхука несёт номер отправителя, тип сообщения и текст; пропускайте всё, где from_me равно true, чтобы бот не отвечал на собственные сообщения.

Вызов LLM занимает несколько секунд, а подтверждение вебхука должно укладываться в миллисекунды. Если обработчик ждёт агента перед ответом, доставка может выйти за таймаут, и то же сообщение придёт повторно — пользователь получит ответ дважды. BackgroundTasks в FastAPI позволяет ответить сразу, а обработать потом.


# webhook_async.py -- fast 200, then reason and reply in the background
import os, requests
from fastapi import FastAPI, Request, BackgroundTasks

app = FastAPI()

def handle(sender: str, text: str):
    answer = reply_for(sender, text)  # the slow part: agent + LLM
    # POST https://gate.whapi.cloud/messages/text
    # If you block the webhook waiting for this, Whapi retries the
    # delivery and the contact gets the same answer twice.
    requests.post(
        "https://gate.whapi.cloud/messages/text",
        headers={"Authorization": f"Bearer {os.environ['WHAPI_TOKEN']}"},
        json={"to": sender, "body": answer},
        timeout=30,
    )

@app.post("/webhook")
async def webhook(request: Request, background: BackgroundTasks):
    data = await request.json()
    for msg in data.get("messages", []):
        if msg.get("from_me"):
            continue
        background.add_task(handle, msg["from"], msg.get("text", {}).get("body", ""))
    return {"status": "ok"}  # returned in milliseconds

Ответ уходит обратно через POST /messages/text: номер отправителя — в поле to, ответ агента — в body. Поскольку маршрут отвечает раньше, чем агент закончит, доставка остаётся быстрой, а баги с двойным ответом исчезают. Чаще всего в сломанных первых сборках мы видим синхронный обработчик, который зависает на модели и незаметно приучает шлюз к повторам.

От прототипа к продакшену: замените MemorySaver на Postgres

MemorySaver помнит до следующего перезапуска, а checkpointer на Postgres — переживает деплои и сбои. Замена в одну строку, потому что правило «номер вместо thread_id» остаётся тем же.

Разверните приложение FastAPI на любом публичном хосте, чтобы URL вебхука был доступен, задайте WHAPI_TOKEN и ключ модели через переменные окружения и замените MemorySaver на PostgresSaver. После этого состояние разговора переживает перезапуски, а те же потоки по пользователям продолжают работать без единого изменения в коде самого агента.

Типичные ошибки при первой сборке (и как их исправить)

На двух ошибках спотыкается почти каждая первая сборка: не та обёртка OpenAI и инструмент, объявленный методом класса. Обе падают ещё при запуске с непонятными сообщениями.

Если передать имя чат-модели вроде gpt-4o в старую обёртку для completions, OpenAI вернёт This is a chat model and not supported in the v1/completions endpoint. Решение — использовать ChatOpenAI, а не класс OpenAI в стиле completion.


# Wrong: completion wrapper rejects chat models
# from langchain_openai import OpenAI
# model = OpenAI(model="gpt-4o")  # -> v1/completions endpoint error

# Right: chat model wrapper
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-4o")

Вторая ошибка появляется, когда вы вешаете @tool на метод экземпляра. LangChain читает self как обязательный аргумент инструмента, и сборка агента падает. Объявляйте инструменты функциями на уровне модуля, а общее состояние передавайте через замыкание или глобальный клиент.

Если непонятное поведение возникает на стороне WhatsApp, а не в вашем Python, напишите команде поддержки Whapi.Cloud через чат на whapi.cloud — команда активно помогает клиентам решать проблемы в продакшене. Расшифровку голосовых и поиск по векторам мы здесь не разбираем: и то, и другое надстраивается над этим же циклом и заслуживает отдельного руководства.

Вот и вся сборка: один вебхук Whapi.Cloud принимает, агент LangGraph рассуждает с памятью по номеру телефона каждого собеседника, а один REST-запрос отправляет ответ. Коротким всё это остаётся именно потому, что мы пропустили туннели, верификацию в Meta и одобрение шаблонов. Команды, которые автоматизируют запись на этом цикле, отмечают, что число неявок падает на четверть и больше, — поэтому память для каждого пользователя стоит настроить правильно. Свяжите три шага, как показано, и агент будет вести настоящий разговор от сообщения к сообщению.

Получите бесплатную песочницу Whapi.Cloud

Об авторе

Jason Mitchell

Product Owner в Whapi.Cloud

Строю интеграции с WhatsApp с 2019 года. Всегда рад новым контактам — обсудить кейс использования API, поделиться обратной связью или просто поговорить о технологиях. Найдите меня в LinkedIn.

Цикл из трёх шагов, на котором держится любой агент в WhatsA...
Подключите номер и направьте один вебхук на ваше приложение
Соберите ReAct-агента: он выбирает инструмент, действует и с...
Приравняйте thread_id к номеру телефона — и у каждого пользо...
Почему связка «ngrok плюс Business API» ломается первой
Быстро верните 200, а агента запускайте в фоне
От прототипа к продакшену: замените MemorySaver на Postgres
Типичные ошибки при первой сборке (и как их исправить)

Вебхуки звонков WhatsApp: initiated, r...

Подключите calls.post, ответьте за 2 с и управляйте CRM через плоские JSON-стату...

n8n vs Make vs Zapier WhatsApp API Automation Comparison

n8n, Make или Zapier: что лучше выбрат...

Подробное сравнение n8n, Make и Zapier для автоматизации WhatsApp API в 2026 год...

Zero-Token WhatsApp AI Assistant Architecture

Как создать бесплатного ИИ-ассистента ...

Узнайте, как создать ИИ-ассистента в WhatsApp без затрат на токены с помощью Met...

Programmatic WhatsApp Username Claim Hub

Не ждите запуска: как программно зарез...

Глобальный запуск юзернеймов от Meta вводит 128-символьные BSUID. Узнайте, как п...

Частые вопросы

Вопросы про агента для WhatsApp на LangChain

Нет. ngrok нужен только тогда, когда туннелем приходится открывать доступ к локальной машине. С Whapi.Cloud вы подключаете номер по QR-коду и указываете размещённый URL вебхука в настройках канала, поэтому входящие сообщения уходят POST-запросом сразу в ваше развёрнутое приложение FastAPI. Шаг с туннелем, которого требует большинство туториалов, исчезает полностью.

В официальном Business API сообщения вне 24-часового окна должны быть заранее одобренными шаблонами, и Meta берёт плату за каждый доставленный шаблон. С Whapi.Cloud агент отправляет ответ обычным текстом через <code>POST /messages/text</code>, поэтому нет ни шага с одобрением шаблонов, ни поштучной платы за них.

Разверните приложение FastAPI на публичном хосте, задайте токен и ключ модели через переменные окружения и замените MemorySaver на checkpointer на Postgres. Логика «номер вместо thread_id» остаётся прежней, но состояние разговора теперь переживает перезапуски и деплои, а не сбрасывается из памяти.

Подключите к агенту checkpointer и в каждом вызове invoke передавайте <code>thread_id</code>, равный номеру телефона отправителя. После этого LangGraph хранит и восстанавливает отдельный разговор для каждого потока, и каждый контакт сохраняет свой контекст. Без checkpointer все пользователи делят одно состояние, и разговоры смешиваются.

Обработчик вебхука зависает на вызове LLM, прежде чем вернуть ответ. Когда ответ приходит медленно, доставка выходит за таймаут и сообщение присылают снова — агент отвечает дважды. Сразу возвращайте HTTP 200, запускайте агента в фоновой задаче, а ответ отправляйте отдельным вызовом API.

Вы повесили <code>@tool</code> на метод класса, поэтому LangChain читает <code>self</code> как обязательный аргумент инструмента, и сборка агента падает. Объявляйте каждый инструмент функцией на уровне модуля, а общее состояние передавайте через замыкание или глобальный клиент вместо <code>self</code>.

Что построили наши клиенты
с Whapi.Cloud

"Cart reminders with a 5% follow-up coupon lifted our recovery rate from 4% to 11%. Customers reply directly in WhatsApp — our team closes the sale right there."

Abandoned Cart Recovery

Hans M., Germany

"Managing 40+ segment groups became trivial — auto welcome messages, pinned updates, inactive member cleanup. Lead gen from WhatsApp groups grew 3x in two months."

Automated Group Management at Scale

Carlos S., Brazil

"Guests receive door codes, WiFi credentials, and a local guide automatically on arrival. Checkout is confirmed via a photo on WhatsApp. Front desk load dropped 40% in the first month."

Contactless Hotel Operations

Ana M., Romania

"Our deals channel has 12,000 subscribers. Whapi.Cloud scrapes competitors, filters duplicates, and auto-posts the top 5 daily. Channel growth tripled after switching to automated posting."

Automated Deal Channel Publishing

Katrin S., Germany

"We verified 93,000 active WhatsApp numbers from 180,000 contacts in 48 hours. Campaign open rates improved significantly by stopping spend on inactive numbers."

Large-Scale Audience Filtering

Sergio N., Spain

"Patients book appointments and check lab results on WhatsApp. The bot handles 200+ daily queries without staff. Appointment no-shows dropped 30% after automated 24h reminders."

Healthcare Bot — Scheduling & Results

Dr. Fernanda O., Brazil

"Post-purchase WhatsApp messages with a tailored discount at day 14. Birthday coupons see 45% redemption — far above our email rate. Repeat purchases via WhatsApp: 18% of total revenue."

WhatsApp Retention Campaigns

Lukas W., Germany

"Customers get a WhatsApp tracking link the moment their parcel ships. Support tickets dropped 35% in 3 months — mostly 'where is my order?' queries simply disappeared."

Automated Shipping Notifications

Matei P., Romania

Собственная разработка и управление

Что такое Whapi.Cloud?

Whapi.Cloud -- это интуитивный API, который напрямую подключает ваш бизнес к WhatsApp без лишних сложностей. Создавайте ботов поддержки, планируйте встречи, отправляйте уведомления, управляйте группами и каналами, автоматизируйте подтверждения заказов и отслеживайте все через вебхуки. Сосредоточьтесь на развитии бизнеса, пока API берет на себя обмен сообщениями.

Наш сервис обеспечивает полный контроль и управление группами, сообществами и каналами WhatsApp.

Добавляйте динамику и новые возможности: медиа, кнопки, реакции, сторис, заказы и товары. Все это доступно для взаимодействия с клиентами.

Наша команда поддержки быстро ответит и поможет с любыми вопросами!

Попробовать автоматизацию WhatsApp Смотреть
демо

Как создать ИИ-агента для WhatsApp на LangChain и Whapi.Cloud: руководство на Python

Цикл из трёх шагов, на котором держится любой агент в WhatsApp

Подключите номер и направьте один вебхук на ваше приложение

Соберите ReAct-агента: он выбирает инструмент, действует и смотрит на результат

Приравняйте thread_id к номеру телефона — и у каждого пользователя будет своя память

Почему связка «ngrok плюс Business API» ломается первой

Быстро верните 200, а агента запускайте в фоне

От прототипа к продакшену: замените MemorySaver на Postgres

Типичные ошибки при первой сборке (и как их исправить)

Об авторе

Jason Mitchell

contents

recent posts

Вебхуки звонков WhatsApp: initiated, r...

n8n, Make или Zapier: что лучше выбрат...

Как создать бесплатного ИИ-ассистента ...

Не ждите запуска: как программно зарез...

Вопросы про агента для WhatsApp на LangChain

Что построили наши клиенты
с Whapi.Cloud

Hans M., Germany

Carlos S., Brazil

Ana M., Romania

Katrin S., Germany

Sergio N., Spain

Dr. Fernanda O., Brazil

Lukas W., Germany

Matei P., Romania

Что такое Whapi.Cloud?

Как создать ИИ-агента для WhatsApp на LangChain и Whapi.Cloud: руководство на Python

Цикл из трёх шагов, на котором держится любой агент в WhatsApp

Подключите номер и направьте один вебхук на ваше приложение

Соберите ReAct-агента: он выбирает инструмент, действует и смотрит на результат

Приравняйте thread_id к номеру телефона — и у каждого пользователя будет своя память

Почему связка «ngrok плюс Business API» ломается первой

Быстро верните 200, а агента запускайте в фоне

От прототипа к продакшену: замените MemorySaver на Postgres

Типичные ошибки при первой сборке (и как их исправить)

Об авторе

Jason Mitchell

contents

recent posts

Вебхуки звонков WhatsApp: initiated, r...

n8n, Make или Zapier: что лучше выбрат...

Как создать бесплатного ИИ-ассистента ...

Не ждите запуска: как программно зарез...

Вопросы про агента для WhatsApp на LangChain

Нужен ли ngrok, чтобы собрать ИИ-агента для WhatsApp на LangChain?

Обязательно ли использовать шаблоны сообщений, чтобы отвечать в WhatsApp?

Как перенести прототип в продакшен?

Как работает память по каждому пользователю в WhatsApp-боте на LangGraph?

Почему мой WhatsApp-бот отвечает дважды на одно и то же сообщение?

Почему декоратор @tool в LangChain выдаёт ошибку про дублирующийся «self»?

Что построили наши клиентыс Whapi.Cloud

Hans M., Germany

Carlos S., Brazil

Ana M., Romania

Katrin S., Germany

Sergio N., Spain

Dr. Fernanda O., Brazil

Lukas W., Germany

Matei P., Romania

Что такое Whapi.Cloud?

Управляйте группами и каналами

Используйте интерактивные сообщения

Получите быструю поддержку

Что построили наши клиенты
с Whapi.Cloud