Всі три основні телефонні платформи тепер мають власний голос. У Apple є Siri, у Microsoft - Cortana, а у Google - дещо менш зухвалий Google Now
Ці системи дозволяють вирішувати основні завдання за допомогою голосового управління. Кожен з них є свого роду віртуальним секретарем, який може відповідати на прості питання, відкривати додатки, робити нотатки і передавати повідомлення. Вони корисні, але вони також обмежені. Вони не можуть робити нічого, для чого вони не були запрограмовані явно, і багато завдань просто виходять за рамки їх можливостей.
Тим не менш, існує ряд розроблюваних технологій, які значно поліпшать ці системи, і вони стануть комерційно доступними вже через кілька років. Ось п'ять основних способів, якими ваш телефон стане набагато розумнішим.
Це буде бачити те, що ви бачите
За останні п'ять років розпізнавання мови досягло величезних успіхів завдяки розвитку потужних нейронних мереж. Сучасні смартфони можуть розпізнавати мову з дивовижною точністю (це було давно, оскільки Google Now неправильно мене зрозумів), і навіть можуть робити такі речі, як ідентифікація пісень і телевізійних шоу на основі їх аудіо.
Це здорово - але це тільки початок. Люди не взаємодіють зі світом насамперед через звук. Ми використовуємо зір практично для всього - і скоро наші машини теж будуть. Ми починаємо бачити дебют перших носимих дисплеїв гарнітур, таких як Google Glass і Microsoft HoloLens. зі складання, який може передавати інформацію зі своїх камер на ваш смартфон, забезпечуючи багатий і завжди доступний візуальній інформації. Багато спостерігачів, включаючи мене, очікують, що вони стануть звичайними протягом наступних п'яти років або близько того.
Так що ж може зробити ваш телефон з усіма цими даними?
Багато. Google вже продемонстрував на своєму смартфоні Tango планшет що глибинна камера може визначати просторове місце розташування фізичних об'єктів з надзвичайно високою точністю. Аналогічним чином були досягнуті деякі дивовижні досягнення в області машинного зору - наприклад, нейронна мережа Microsoft, яка може ідентифікувати окремі породи собак, і нейронна мережа Google, яка може точно описувати зміст фотографій. Разом ці технології відкривають цілий світ додатків:
Що це за болт? Алгоритм машинного зору знає і може замовити заміну на Amazon за п'ять секунд. Як звали жінку, яку ви зустріли в барі минулої ночі? Можливо, ви втратили її картку, але ваші окуляри зловили її обличчя, і ви можете знайти її на Facebook. У тебе дивна родимка. Чи повинні ви звернутися до лікаря? Ваш телефон може подивитися і повідомити вам. Ви продуктовий магазин: що вам потрібно? Ваші окуляри пам'ятають, коли ви востаннє заглядали в холодильник, і знаєте, чого не вистачає. Вони можуть навіть дати вам вказівки проходити за проходом, щоб знайти окремі предмети.
Наслідки цієї технології для конфіденційності жахають, але подібні речі звучать неймовірно корисно.
Це буде знати, що вам подобається
Смак може бути важко визначити. Це дуже особисте і може бути дуже довільним. Spotify і Netflix обходяться розробкою рекомендацій, заснованих на шаблонах використання (метод, який повністю ігнорує контент), але у цього підходу є реальні обмеження.
Майбутнє за алгоритмами, які можуть розуміти мистецтво на глибокому рівні - складні нейронні мережі, які можуть навчитися вибирати складні тонкощі музики і фільмів. Це дає набагато більш глибоке розуміння того, що людям подобається і що не подобається в ЗМІ - конкретне розуміння їх смаку.
Перші ранні натяки на це починають з'являтися. Наприклад, плейлист Spotify «Discover Weekly», в якому використовуються такі інструменти аналізу контенту, щоб рекомендувати пісні, в тому числі пісні, які ви зазвичай не чуєте, тому що вони занадто неясні для хорошого ранжування залежно від моделей використання. Ці методи будуть ставати все більш потужними в майбутньому, і смартфон стане відмінною платформою для використання цієї інформації.
Шукаєте щось робити з друзями? Що, якщо програми на ваших телефонах можуть співпрацювати, об'єднувати інформацію про ваші смаки і вибирати фільм або концерт, який, на їхню думку, вам сподобається? А як щодо сайтів знайомств, які оцінюють вас на основі глибоких особливостей ваших відповідних смаків? А як щодо додатків, які можуть порекомендувати вам книги, тому що вони їх прочитали?
Можливості нескінченні, і хтось збирається заробити на цьому багато грошей.
Это будет болтливый.
Людина: де ти зараз
? я в глушині.
Людина: Яка мета смерті
? щоб мати життя.
Людина: яка мета бути розумним
? з'ясувати що це таке.
Людина: яка мета емоцій
? Я не знаю.
Це розмова з нейронною мережею, розробленою Google, яка вчиться на великих текстових базах даних без участі людини. Ця версія була навчена на декількох старих сценаріях фільму і навчена передбачати наступну пропозицію в кожній розмові, з якою зіткнулася. Виявляється, якщо ви тренуєте ШІ за сценаріями фільму, всі його розмови супер драматичні.
Якщо ви не вражені, це зрозуміло. Чатботи існують вже давно.
Але придивіться. Система Google особлива в двох ключових аспектах.
По-перше, це дуже просто з точки зору архітектури: це єдина величезна нейронна мережа, і їй довелося самостійно вивчати динаміку людської мови. Звичайні чат-боти працюють, використовуючи тисячі правил, написаних вручну, щоб реагувати на різні ситуації. Коли вони повторюють відповідь, це тому, що він був закодований вручну або запам'ятаний з конкретного прикладу. Мережа Google відрізняється. Він вивчив свою поведінку органічно, намагаючись зрозуміти глибоку структуру людського письма.
По-друге, він відображає напрочуд тонку динаміку, якої немає у інших чат-ботів. Він може відповідати на запитання здорового глузду про мир, незважаючи на те, що не був явно запрограмований на це.
Людина: хто такий скайвокер
? він герой.
Людина: хто такий Білл Клінтон
? він мільярдер.
Людина: блакитний або чорний
? синя.
Людина: у кішки є хвіст
? Так.
Людина: у кішки є крило
? Нетлюдина
: чи може кішка літати
? ні.
Людина: скільки ніг у кішки
? чотири, я думаю.
Інша версія чат-бота, навчена журналам технічної підтримки, може дивним чином забезпечити реальну технічну підтримку. Є спотикання (здається, важко згадати, яку операційну систему ви використовуєте) - але я безумовно отримав гіршу технічну підтримку від реальних людей.
Все це є хорошим показником того, що ми починаємо наближатися до того моменту, коли штучний інтелект може бути дійсно розмовним. Вищенаведена мережа може вести терпиму розмову, навіть якщо її цілі навчання вимагають від неї тільки слідувати поверхневій структурі діалогу вперед-назад.
Враховуючи кращі дані навчання та функцію винагороди, яка підкреслює обмін інформацією, можливості безмежні. Уявіть собі версію Siri, яка може залучити вас до справжньої бесіди, надати відповіді та поради у відповідь на запитання, а також виконувати завдання, не вимагаючи спеціального програмування для цього. Це не далеко.
Це буде добре читати
Ще одна технологія, над якою працює Google, пов'язана з розумінням прочитаного. Він називається «вектори думки», і концепція на подив проста. Ви можете отримати «вектори думки» з діяльності нейронної мережі, в якій є фрагмент інформації, наприклад, пропозиція або стаття. Те, що ви отримуєте, є непрозорою частиною інформації, яка нічого не означає ні для кого, крім мережі, яка її згенерувала. Ця частина інформації, в деякому сенсі, зберігає «значення» тексту окремо від того, як воно було спочатку сформульовано.
Це має деякі корисні властивості. Для початку, ці вектори нагадують один одного для пропозицій з аналогічними значеннями. Якщо ви перетравлюєте два речення таким чином, ви можете визначити, чи означають вони одне і те ж. Ви також можете маніпулювати ними. Використовуючи дві нейронні мережі для створення «векторів думки» з тексту різними мовами, а потім навчаючи третю мережу, щоб навчитися відображати між ними, ви можете створити надзвичайно потужний метод машинного перекладу, який фіксує значення тексту, а не тільки слова в ньому.
Іншим потенційним застосуванням цього є використання цієї технології для збору великої кількості інформації та її перетворення на компактне представлення, а потім генерування зведення на основі результатів. Це може бути дуже потужним для мобільних додатків.
Уявіть собі, що ви можете попросити ваш телефон піти і прочитати все, що доступно в Google по даній темі. Потім поверніться до вас і коротко повідомте про свої висновки природною мовою і відповідайте на запитання про результати. Це стане реальністю дуже скоро, і це буде неймовірно корисно.
Телефон майбутнього
Телефони в майбутньому, ймовірно, будуть сильно відрізнятися від телефонів сьогодні. Вони можуть бути вигнуті. Вони можуть бути модульними. Ви можете взаємодіяти з ними, використовуючи окуляри доповненої реальності. Однак найважливішою відмінністю буде інтелект. Описані тут функції перетворять наші пристрої на потужних викладачів і помічників.
В даний час розгорається гонка озброєнь в технології глибокого навчання. Побічним ефектом є те, що ці методи розвиваються неймовірно швидко, і вони з'являться на ринку раніше, ніж ви думаєте.
