Искусственный интеллект наступает. Делимся сервисами

 Публичный пост
29 августа 2022  454

В общем не хочу сгущать краски, но посмотрел инструменты, которыми пользуюсь в повседневной жизни и понял, что искусственный интеллект (ИИ, AI) это не будущее, это наше сегодняшнее. Ссылки на сервисы прилагаются.
_____________

Поисковики

На старых конференциях Яндекса иногда бывали очень забавные случаи: человек говорит о проблеме на сайте в связи с каким-то новым фильтром/алгоритмом, спикер говорит, что для них поисковая машина сейчас темная коробка и никто достеменно не знает, как она работает. Конечно, лукавят, конечно, ручками подкручивают, постоянно корректируют, но все же базовые алгоритмы явно машинные. И если вы пользуетесь Яндексом (кстати, кто не знал, у них есть интерфейс без рекламы, который станет скоро основным), Гуглом или другим крупным поисковиком, знайте, вы уже работаете с ИИ.

Тексты

С поиском по тексту разобрались, но есть еще и другие операции с текстом, которые уже сейчас с разной степень успеха выполняет ИИ. Начнем с любимых нами переводчиков текста. Да, это тое делают машины, которые пытаются улавливать языковые тонкости, чтобы сделать максимально точный перевод. Помните, как первые переводчики выдавали результат без склонений по падежам и сопряжений, сейчас это совсем иной уровень:

  • https://www.deepl.com/ru/translator (этим пользуюсь чаще всего и выдает самый качественный результат)
  • https://translate.yandex.ru/ (хорошо для вариаций с русским языком, но другие пары проигрывают гугловскому)
  • https://translate.google.com/?hl=ru

Но кроме перевода текста есть еще и его генерация. Почти все публичные сервисы они построены на языковой модели GP3, но есть и вариации. Что здесь можно сказать, подобных сервисов очень много, но на русском языке адекватно работающих пока не встречал (есть Порфирьевич и сберовский, но то такое, ИМХО), из англоязычных много не тестировал, но понравился этот.

Текст, который генерирует сберовский сервис
Текст, который генерирует сберовский сервис

Нужно сказать, что полноценных генераторов текстов пока нет, все они лажают в разной степени, но явно прослеживается прогресс. Например люди уже клепают статейные сайты и дорвеи с помощью подобных сервисов. Насколько эффективны подобные технологии, трудно сказать, но стоимость на порядок ниже копирайтеров, а значит все больше и больше пользователей будут поддерживать денежкой эту сферу, что даст рано или поздно достаточные инвестиции для текстовых алгоритмов.

Аудио

Начну с перехода от текстов к аудио формату. Например, голосовые помощники/читалки уже вполне хорошо справляются с читанием текстов, да может и есть некие лажи в паузах, интонациях, но в целом технологии перевода из текста в аудио уже применяю. Например, яндексовская Алиса читает некоторые лонгриды на фоне, когда мне лень, а еще есть вот такой чудный сервис, который, на удивление, даже стихи неплохо озвучивает, а затем аудио можно скачать и прослушать на фоне.

Есть и обратные сервисы. Транскрибация аудио в текст. Помните про автоматические субтитры в Youtube, или перевод в текст аудио-сообщений в Телеграме (https://telegram.org/blog/700-million-and-premium/ru), еще есть голосовые блокноты и многое другое в этой технологии. Но самое распространенное - это голосовой ввод, который есть на большинстве смартфонов, он есть в поисковиках, мессенджерах, социальных сервисах и много где еще. Это, пожалуй, самая распространенная и доработанная ИИ технология на момент.

А еще есть сервисы, создающие музыку по заданным условиям или стилям, обработка аудио-дорожек для устранения шума и много других интересных сервисов, которые используют музыканты и те, кто работают с музыкальным творчеством.

Картинки и фото

Вообще, именно графические элементы стали базисом для развития ИИ в свое время. Поэтому здесь сформировались сильные сервисы в разных способах применения: это и поиск по картинкам у поисковиков (https://yandex.ru/images/, https://www.google.ru/imghp), и различные сервисы по улучшению качества фотографии (https://zyro.com/ru/instrumenty/uluchshyt-kachestvo-foto, https://letsenhance.io/ и много других) и ретушь, восстановление старых фотографий (такая функция на основе ИИ появилась в Фотошопе и Иллюстраторе).

Но особо интересно лично мне направление генерации картинок из текста. Здесь открывается неограниченное поле для творчества, доступное обычному смертному. Таких сервисов много, но наиболее известны сейчас https://openai.com/dall-e-2/ и https://www.midjourney.com/home/. Для того, чтобы понять, что эти нейросети могут уже сейчас посмотрите картинки в поиске или на ютубе, это поражает.

Генерация по запросу: предприниматель, который потерял все, но при этом улыбается
Генерация по запросу: предприниматель, который потерял все, но при этом улыбается

Видео

Здесь не силен, поэтому ограничусь лишь общим описанием направлений. Уже есть сервисы, генерирующие видео по текстовому описанию, создание простеньких анимаций.

Не знаю на сколько правильно с точки зрения заложенных технологий объединять виртуальную реальность, дополненную реальность и дипфейки и насколько правильно это называть видеоформатом, но то, что это технологии, которые очень много чего изменят - это однозначно. Например, президент какой-то страны, выступающий с призывами к участию в пирамиде или в чем-то еще хуже вполне может иметь место быть в ближайшее время. Или прохождение обучения военными с загрузкой рельефа местности предстоящей операции (это, кстати, уже происходит), либо полная симуляция полета для обучения пилота.

Конечно, нужен будет и поиск по видео-контенту. Сейчас это, кстати, очень сырое направление. Просто сравните поиск по фото и видео и разница станет понятна.

Другое

Здесь все не перечислить. Из того, что вспоминается из последнего: поиск полезных ископаемых, корректировки ставок в рекламе в зависимости от прогноза погоды и вероятности покупки того или иного ассортимента, всевозможные "умные" ленты, распознавание объектов на космических снимках, предсказание погоды и землетрясений, моделирование белков и свойств химических соединений, беспилотные автомобили и дроны и это только то, что на поверхности.

Приветствую всех в технологическом будущем, которое уже наступило!

Если у вас есть опыт работы с ИИ, нейросетями, машинным обучением, есть крутые сервисы на основе ИИ очень прошу не жлобиться и черкнуть пару строчек с ссылочками в комментарии к этому посту

6 комментариев 👇
Kostas Obuchow , Интернет-предприниматель 29 августа 2022

Картинки и фото
https://thisxdoesnotexist.com/
с подтемами
https://thispersondoesnotexist.com/
https://thiscatdoesnotexist.com/
https://thisrentaldoesnotexist.com/

  Развернуть 1 комментарий

@Kostas, крутые сервисы. Я отсюда генерировал аватарки для профилей в соцсетях под 1 проект, а дочь у них любит лошадок создавать.

  Развернуть 1 комментарий

@tarasusatyi, да, мы тоже использовали фото людей для создания профилей в фб

  Развернуть 1 комментарий
Kostas Obuchow , Интернет-предприниматель 29 августа 2022

https://www.watermarkremover.io/ru
не совсем этично, но работает )

  Развернуть 1 комментарий
Тарас Усатый , Философ-вебмастер автор 30 августа 2022

А ещё, как же без роботов в кулинарии. Это и создание новых рецептов, и целые аппараты, которые копируют действия человека по заданной программе, а Собчак вон вообще мастер-шефом сделала бота.

  Развернуть 1 комментарий
Тарас Усатый , Философ-вебмастер автор 30 августа 2022

Вспомнил ещё одно интересное применение искусственного интеллекта - автоматический обзвон по базе данных. Это смесь голосовых технологий и обработки текста в одном флаконе.
У продажников в примерах очень крутые аудиозаписи с допродажами по скриптам, по факту бот ещё "буксует", но цена содержания такого бота и оператора коллцентра просто не сопоставимы.

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб