Как стать автором
Обновить

Запросы к Twitter API на синтаксисе SQL

Время на прочтение1 мин
Количество просмотров1.5K
Язык запросов TweeQL сделан по образцу SQL-синтаксиса и позволяет работать с базой твитов так же просто, как с реляционной базой данных.

TweeQL имеет следующий синтаксис:

SELECT field1, field2 FROM streams WHERE filter_conditions GROUP BY field3, field4 WINDOW x seconds

Например, запрос вида

SELECT text FROM twitter_sample WHERE text contains 'bobuk'; 

просто вытягивает из потока твитов те фрагменты, в которых упоминается 'bobuk' (bobuk здесь просто ради примера как самый активный пользователь Twitter API в Рунете).

Всё это без необходимости думать о всех деталях для правильного API-запроса.

TWITTER_SAMPLE — это поток твитов, который содержит примерно 1% от общего их числа. Если нужно делать запросы к общему потоку, указывайте в качестве источника данных TWITTER.

Отфильтрованные твиты можно сохранять в базу данных на локальном диске (её параметры задаются в settings.py). По причинам производительности запись в базу данных осуществляется только при достижении 1000 записей, так что если отфильтрованных записей меньше — они не сохранятся.

TweeQL закодирован на Python.
Теги:
Хабы:
+30
Комментарии34

Публикации