تلاش رئیس SIRI برای زندگی بخشیدن به آن
منتشر شده در مجله کسبوکار هاروارد
در فرایند طولانی طراحی و تکمیل محصول، غالباً لحظۀ منحصربهفردی وجود دارد که در آن واکنشهای مشتری بر تردیدهایی که پیرامون هر تلاش خلاقی وجود دارد، غلبه میکند.
برای سیری، دستیار شخصی مجازی که اکنون جزء جدانشدنی از آیفون اپل است، در سال ۲۰۰۹ وارد یک هواپیما شدم. تازه در صندلی خود در پروازی که تأخیر داشت نشسته بودم که مسافری از من سؤال کرد: «چه زمانی فرود میآییم؟» ازآنجاکه من جز دهنفری بودم که برای آزمایش سیری انتخابشده بودم، گوشیام را بیرون آوردم و گفتم: «سیری! پرواز ۹۸ یونایتد چه زمانی به مقصد خواهد رسید؟» هنگامیکه سیری زمان رسیدن را در لحظه پاسخ داد، مسافر بُهتزده گفت: «فقط یک سؤال از شما دارم: چرا در این قسمت هواپیما نشستهاید؟ شما باید میلیاردر باشید! »
من آنچنان غرق در چالشهای اقتصادی، فناوری و مالی پروژههای جدید شده بودم که از حیرتانگیز بودن سیری غافل شده بودم. مبهوت شدن یک غریبه باعث شد که ماجرا به من یادآوری شود؛ ما یک برنامه کاربردی برای گوشیهای هوشمند طراحی کرده بودیم که میتوانست با استفاده از زبان طبیعی سؤالات را درک کند و به آنها پاسخ دهد. ما درصدد بودیم که هوش مصنوعی را در اختیار میلیونها مصرفکننده قرار دهیم.
راهی دور و دراز با چندین پیچ شگفتانگیز در پیش روی ما بود.،،،
دره مرگ
بهعنوان رئیس اسآرآی، گروهی را رهبری میکنم که در این شرکت سرمایهگذاری، توسعه و جداسازی میکنند.
من شغل شگفتانگیزی دارم، هرروز توسعه فناوریهای پیشرفته باقابلیت امنتر، سالمتر و با بهرهوری بیشتر را نظاره میکنم. اما دره مرگی میان ابداع و نوآوری وجود دارد. دره مرگ، استعارهای رایج در دنیای سرمایهگذاری است؛ زیرا اغلب اختراعات پیش از آنکه به بازار برسند، به دلیل نبود بازار بزرگ و در حال رشد و همچنین فقدان پیشنهاد ارزشمند و طرح تجاری یا منبع کافی، نابود میشوند.
وظیفه من این است که به فرصتها کمک کنم تا از این دره مرگ عبور کنند. گاهی ما موفقیتهایی به دست میآوریم که تصورش را هم نمیکردیم. سیری در واقع یک موفقیت شگفتانگیز بود. چشمانداز بازاری که منجر به سیری شد به سال ۲۰۰۳ بازمیگردد، هنگامیکه برنامههای اصلی گوشیهای همراه محدود به صدای زنگ و پیامرسان بودند، ما متوجه شدیم قابلیتهای روبه رشد گوشی درنهایت یک ابر رایانه ارتباطی را در جیب همه قرار خواهد داد و معتقد بودیم که اسآرآی اینترنشنال، در موقعیتی قرار دارد که میتواند رهبر فناوری و انقلابی در بازار باشد.
ما برای توسعۀ بازار تیمی تشکیل دادیم و نام آن را « مخالفان» گذاشتیم. برخی از این مفاهیم پنداشتند که هوش را در گوشیها قرار دهند تا کاربران بتوانند از طریق متن یا صدا از او بخواهند کارهایی را انجام دهد. نظیر انجام مکالمه، برقرای تماس و یا سفارش مواد غذایی.
در همان زمآنکه تیم مخالفان تشکیل شد، برنامهای ۱۵۰ میلیون دلاری برای توسعۀ یک دستیار نرمافزاری «شناختی» تأمین کرد. مفاهیم برنامه مؤسسه پروژههای تحقیقاتی پیشرفته دفاعی آمریکا به تفکر محافظان کمک کرد و سرانجام الهامبخش توسعۀ سیری شد. ایجاد یک فعالیت مستقل هدف نهایی ما نبود؛ ما با دهها شرکت مخابراتی و تولیدکنندههای گوشی همراه گفتوگو کردیم و هدفمان پایهگذاری پروژه مشترکی بود که به فناوری ما مجوز بدهد و یک دستیار هوشمند در دنیای تجارت به وجود آورد. این مسئله دشوار بود. بارها و بارها اعتراضات گوناگونی شنیدیم: «امکان ندارد؛ این پروژه بیست سال با ما فاصله دارد، بسیار پرهزینه است (ما به دنبال ۵ تا ۱۰ میلیون دلار برای هزینههای توسعه بهعلاوه هزینههای صدور مجوز بودیم)، مدل تجارت ما نیست، ایجاد یک محصول بیش از ۱۲ ماه طول خواهد کشید، درآمد بهسرعت به دست نمیآید، خودمان قبلاً این کار را انجام دادهایم». ما چند پروژه با شرکتهایی که بخش کوچکی از دیدگاه ما را اجرا کردند، انجام دادیم، اما درنهایت تصمیم گرفتیم از اسآرآی خارجشده و برای ایجاد یک گروه کاملاً جدید سرمایهگذاری کنیم.
چهار ماده
تیم رهبران اسآرآی هرروز در فضای سرمایهگذاری گرد هم میآمدند تا در مورد بازار و امکانات محصول بحث کنند. ما میدانستیم برای اینکه موفق شویم به چهارعنصر اصلی نیاز داریم: یک راهحل برای مشکل بزرگ و مهم و یا نقطۀ درد، باقابلیت رشد سریع بازار، یک فناوری متمایز که برنده رقابت باشد. تیمی که قادر به اجرای برجستۀ طرح باشد و یک ارزش پیشنهادی به مشتری و طرح تجاری که استراتژی و ارزش سرمایهگذاری را بیان کند، بدون این چهارعنصر، احتمال موفقیت صفر خواهد بود. ما همچنین میدانستیم؛ قبل از آنکه رقبا وارد بازار شوند یا پولمان تمام شود، برای موفقیت و ورود به بازار تنها زمان کوتاه و منابع مالی محدود در اختیارداریم.
نقطۀ درد
تیم موردنظر طی چند ماه، فرصت حضور در بازار را از دست داد. مردم از کلیک کردن مداوم گوشی برای انجام کارهایشان سرخورده شده بودند (کلیک کردن گوشی در سال ۲۰۰۷ خیلی رایج نبود). تحقیقات نشان داد، با هر بار کلیک کردن، ۲۰٪ کاربران از خرید منصرف میشدند.
ایدۀ سیری، در عین سادگی بسیار قدرتمند بود. سیری برخلاف موتورهای جستوجو، بهصورت یک موتور «صدا محور» عمل میکند، مشکل شما را درک کرده، به اطلاعات موردنیاز دسترسی و برای آنها پاسخ مناسبی پیدا میکند. سیری تمام این کارها را بهجای کاربر متقبل میشود؛ بلیت فوتبال خریداری میکند، میز شام رزرو میکند و مردم میتواند بهوسیله آن وضعیت آبوهوا و یا سریال تماشا کنند.
فناوری متفاوت
فناوری موردنیاز برای بررسی این نقطه از درد دلهرهآور بود. حتی اگر پیشرفتهای زیادی در پشت آن باشد اما تبدیل گفتار به متن دیجیتال، بخش سادۀ آن بود؛ سیری در سال ۱۹۹۴ یک رهبر جهانی گفتاری راهاندازی کرد، بخش اصلی آن تجزیهوتحلیل کلمات بود تا هدف کاربر را درک کرده و درخواست او را استدلال کند و به آن پاسخ دهد. ابتدا کامپیوتر میبایست مفاهیم را شناسایی کند و گروهی از کلمات را با آن مرتبط کند. انسانها این وظایف را بهراحتی انجام میدهند اما آن را برای رایانهها غیرممکن میدانند.
پایۀ وسیع فناوری برای فهم زبان طبیعی توسط آزمایشگاه فناوری گفتار و تحقیقاتی و مرکز هوش مصنوعی اسآرآی در برنامههایی با DARPA با سرمایهگذاریهای داخلی اسآرآی توسعه پیداکرده بود. آدام چایرو دیدیه گوتزونی مدیریت ویژهای بر عهده داشتند تا ما بتوانیم از سیری محصولی بسازیم که برای میلیونها نفر کاربردی باشد.
چایر یکی از خوشبینترین دانشمندان علوم رایانهای اسآرآی، طی دو دهه، محاسبات واگذارشده و سیستمهای مبتنی بر عامل را طراحی و اجرا کرد و به افراد این امکان را داد تا با شبکهها تعامل داشته باشند. چایر به همراه گوزونی، که دانشجویش بود، رویکردهایی برای درک زبان طبیعی ایجاد کرد که کار پاسخ دادن به پرسشها را ساده میکرد.
تیم
ما خوششانس بودیم که یک کارآفرین باتجربه داگ کیتلاوس را بهعنوان مدیرعامل پروژه جدید جذب کرده بودیم. چایر تصمیم گرفت اسآرآی را ترک کند و به این تیم بپیوندد. نوآور برجستۀ کاربری هوشمند، تام گروبر هم چند ماه بعد به این تیم پیوست و سرانجام مدیر فناوری اطلاعات شد. من و بیل مارک، رئیس اطلاعات و محاسبات اسآرآی بودیم، ما در این شرکت ماندیم و من عضو جدید هیئتمدیره شدم.
ارزش پیشنهادی
طی شش ماه بعد، ارزش پیشنهادی موردتوجه زیادی قرار گرفت؛ ما به کمک محصولی قدرتمند، مشکلی بزرگ را برای میلیونها مصرفکننده مرتفع کردیم، درصورتیکه میتوانستیم بهوسیله آن میلیاردها دلار به دست آوریم. سیری مشکل کلیک کردن را حل کرد، در وقت و انرژی مردم صرفهجویی کرد و از طریق تشخیص گفتار، درک زبان طبیعی و هوش مصنوعی، یک فناوری برجسته و متمایز را به وجود آورد. ما به این نتیجه رسیدیم که مدل کسبوکار سیری برای کمک به انجام معاملات به دریافت هزینه از وبسایتها وابسته باشد و همچنین دریافتیم که درآمد حاصل از سودهای ارائهشده توسط سیری به هتلها، رستورانها و خطوط هوایی میتواند قابلتوجه باشد.
در اواخر سال ۲۰۰۷، پس از شش ماه تلاش بر روی ارزش پیشنهادی، تصمیم گرفتیم برای پروژۀ مستقل خود در بیرون از مرزها، به دنبال سرمایهگذاری خارج از کشور باشیم. ما میدانستیم که یافتن حامی کار سادهای نخواهد بود. بسیاری از سرمایهگذاران، نسبت به واقعیاتی که در مورد هوش مصنوعی شنیده بودند، تردید داشتند. آنها نگران عناصر ارزش پیشنهادی و برنامههای تجاری نظیر بازار، رقبا و فناوری هستند.
آیا میتوانیم به پایگاه مشتری گستردهای دست پیدا کنیم؟ آیا قدرت پردازش گوشیهای هوشمند کافی بود؟ آیا فناوری هوش مصنوعی نتیجهبخش بود؟ آیا سرعت ارتباطات و پردازش بیشازحد کند است؟ آیا مدل کسبوکار درآمد کافی دارد؟ آیا رقبایی نظیر گوگل و مایکروسافت با محصولات خود میتوانند به فناوری پاسخ مناسبی دهند؟
درنهایت نگرانیها کاهش پیدا میکنند اما از بین نمیروند. سیری یک سرمایهگذاری جسورانه اما پرخطر بود. این ابتکار با فناوری پیشرفتهای که داشت تأثیر بسیار زیادی بر صنعت تلفن همراه گذاشت. حاصل همگرایی چشمگیر روندهای جهانی؛ ظهور گوشیهای هوشمند، شتاب گرفتن ظرفیت محاسبات، ذخیرهسازی و افزایش سرعت ارتباطات، رشد خدمات وب و واسطهها و همچنین توسعۀ سیستمهای جدید هوش مصنوعی بود.
ما۸.۵ میلیون دلار سرمایه تهیه کردیم که برای تأمین مالی ۱۸ ماه کافی بود اما تأمین بودجه برای ما از پول دریافتی ارزشمندتر بود. این فرایند به سرمایهگذاران شجاع بصیرتی داد که به شرکای ما تبدیل شوند و به ما در شناسایی مدلهای تجاری، توسعۀ استراتژی و برقراری ارتباط با مشتریان کمک کردند. اما هنوز هم با چالشهای بسیاری مواجه بودیم؛ ما به دلیل مسائل مربوط به پاسخ کند سرور به کاربر و فناوری تشخیص گفتار،شش ماه عقب ماندیم. درحالیکه گوگل و دیگران در حال پیشرفت بودند. برخی شرکتها برای ادغام با ما پیشنهاداتی ارائه دادند، اما شرایط معامله بسیار پیچیده بود. در این میان شرکتهای مخابراتی بیسیم به وجود آمدند که تمرکز را از محصول ما دور کنند.
راهاندازی
سرانجام پس از آزمایشات کاربران ( از نوامبر ۲۰۰۹ تا فوریه ۲۰۱۰)، دقیقاً همان زمانی که قابلیت سیری را در هواپیما نمایش دادم، آماده شدیم که محصول را در فروشگاه اپل قرار دهیم. (اینکه «سیری» به لحاظ تلفظ به «اسآرآی» نزدیک است، کاملاً اتفاقی بود. ما این نام را به چند دلیل انتخاب کردیم؛ اول اینکه از ۴حرف تشکیلشده بود و دوم اینکه در هیچ زبانی معنای منفی نداشت). این رونمایی با موفقیت بزرگی همراه شد و سیری با سرعت نجومی بارگیری شد و در بین ۵۰ برنامه برتر اپل قرار گرفت و نوعی سبک زندگی شد.
دو هفته پس از به بازار آمدن محصول، کیتلاوس تماس غیرمنتظرهای دریافت کرد:«سلام،من استیو جابز هستم.» کیتلاوس فکر کرد کسی با او شوخی میکند و تلفن را قطع کرد. سپس تلفن مجدداً زنگ خورد: «راست میگویم، من استیو جابز هستم.» واقعاً استیو جابز بود. آن دو مدتی با یکدیگر صحبت کردند و جابز به کیتلاوس دربارۀ قابلیت سیری تبریک گفت. او کیتلاوس،چایر و گروبر را به خانهاش دعوت کرد و در مورد فناوری سیری به گفتوگو پرداختند. جابز از ارزش هوش مصنوعی موتور و همچنین ماهیت این فناوری و اشتباهاتی که در تشخیص زبان طبیعی رخ میدهد، اطمینان داشت اما دلسرد نشد. این محصول فوقالعاده بود، همانطور که تمام محصولات اپل «در حد کمال طراحی» شده بودند.
جابز و کیتلاوس در مورد قیمت خرید سیری گفتوگو کردند. ما مشتاق فروش نبودیم، زیرا معتقد بودیم که با آزمایشهای موفق و معاملههای جدید، ارزش تجارت قطعاً افزایش خواهد داشت. اما جابز پیشنهادی داد که سرمایهگذاران و مدیریت اجرایی نتوانستند آن را رد کنند (به دلیل تعهدات قراردادی نمیتوان قیمت را فاش کرد) همچنین تیم علاقۀ زیادی داشت که با جابز و اپل همکاری کند.
یک سال بعد،سیری سرویس محبوب آیفون S4 شد. در ۴ اکتبر ۲۰۱۱ فیلشیلر، معاون ارشد بازاریابی اپل، سیری را بهعنوان جذابترین ویژگی آیفون S4 معرفی کرد. روز بعد استیوجابز درگذشت. من بسیار از او سپاسگزارم که ایدۀ ما را دید. تحلیلگران گزارش دادند که سیری از همان ابتدا به فروش میلیاردها دلار کالا سرعت بخشیده است. سیری همچنان یکی از عناصر اصلی سیستم عامل دستگاههای اپل است.
اپل و دیگر سازمانها نظیر اسآرآی، اکنون در رقابتی هستند که هم پیشرفت فناوری را به دنبال دارد و هم در خدمت بازارهای جدید هستند. کارهای بسیاری میتوان انجام داد. تشخیص گفتار و زبان طبیعی و یادگیری ماشینی هنوز در مراحل ابتدائی به سر میبرد. دستیاران شخصی مجازی در درک کلمات و زبان، بهتر هم میتوانند عمل کنند. آنها محیط کار نرمافزار را حفظ میکنند، مکالمات واقعی را امکانپذیر میسازند، از کابران یاد میگیرند و «متخصص» میشوند و به مشتریان برای دستیابی به اطلاعاتی مانند سوابق بهداشتی و حسابهای بانکی کمک میکنند. بهعنوان مثال، اسآرآی بهتازگی سرمایهگذاری جدیدی به نام کاسیستو را آغاز کرده است که بازسازی تجربۀ بانکداری گوشی همراه از طریق رابط گفتاری، نوشتاری و لمسی است و توانایی مکالمه دارد. آیندۀ دستیاران شخصی بدون شک آیندهای مطمئن است
The efforts of the head of SIRI to bring it to life
Harvard Business Review