来源:王小川 IT时代网
自我揶揄搜狗不上市,不找女朋友的王小川可能要找到女朋友了。7月31日,搜狐宣布,旗下搜索业务子公司搜狗将在IPO。随后,王小川在内部信中予以证实。
口述 ✎王小川
文 ✎ 创业家i黑马
狐狸生下狗,我觉得还是有它的历史意义。2013年8月15日,王小川曾给黑马成长营六期同学做两个小时的精彩分享,有关搜狗的来路与去向,创业的道与术。时隔四年,你依然能品咂到鸡汤之外的风与骨。
以下为王小川在黑马成长营的授课节选,经创业家i黑马编辑。
我从1999年开始进入互联网,在ChinaRen,2000年它被搜狐收购了,我又在搜狐,从一线的工程师做起,2003年正式研究生毕业,之后算正式全职加入搜狐。
最早在三大门户里,搜狐技术是排最后一位的,排在第一位的是网易,第二位是新浪。但搜狐那会收购ChinaRen的目的不是为了技术,是为了SNS。ChinaRen的技术底子留下来了。
百度在2003年开始已经初露锋芒了。百度1999年开始做,之前新浪只给消费者提供广告服务,百度向新浪收取搜索服务费,但觉得自己不能够只去收服务的钱,开始卖搜索广告,开始卖的不高,搜的结果加在给新浪的结果里面,你分辨不出来。
本来新浪自己就卖广告的,那多少是卖给新浪,多少是卖给百度的?所以新浪那会儿就把百度给停了,就是不给钱,百度搜索返回的结果就是新浪欠费,两家就搞的特别针锋相对。
搜狐也在考虑自己做搜索营销,有这么一个源头。百度那会儿要建自己的入口,提供的搜索结果质量不一样,给你索引6千万页面,给自己索引1亿页面,品质比你好。
找清华兼职学生做搜狗
搜狐技术特别薄,那会儿做搜索,在搜狐基本上找不到一个会写C语言的,能写个PHP那会儿就算不错的了。但搜狐就想做搜索,正好赶上搜狐有点儿钱。
2003年无线增值起来了,搜狐靠着SP那东西,赚了很多钱,因此也愿意投入,做一些其它项目。否则以前老是亏钱也很难受的。老张(创业家i黑马注:张朝阳)是属于从来不局限于我有什么,他只想我要什么,这也是个好习惯。
搜狐有游戏基因吗?没有,我就要游戏,折腾好几轮游戏,找到人就干了(最后还干成了畅游)。做搜索也是,死活要做,就找到我,给了我6个人头,说你用搜索把百度干掉。
我那会儿叫做无知者无畏。6个人头还不是6个人,我知道6个人肯定不够。我说这样吧,你把它换成12个兼职的,便宜一半的人,12个人可能好一点。
(*搜狗CEO王小川)
真正做技术我有概念,我相信自己技术在全国就是,写程序在全国排在第一,就接了这个活。我接了这个活之后去清华招兼职学生,因为你招全职学生是不肯过来的。
全职的人说,我愿意到有技术背景的公司里去工作,而搜狐那会儿,包括中国那几个互联网公司都不怎么样,那会儿时髦的是IBM。那种情况下到学校找兼职学生才有机会。我就找清华顶尖的计算机系的学生。
搜狐那会儿没用过猎头,就没挖过人,不像现在360做搜索,做搜索肯定挖一堆人过去。我一个没挖过,全是兼职学生,就那种感觉,有点像中国造核弹。
我在ChinaRen工作时我是兼职学生,后来在搜狐的时候找兼职做搜索,一说大家觉得很好笑,但是很管用。比如说学生有个问题就是,他不守时,今天说不来就不来,他也不缺你那口饭吃,开除也无所谓,睡个午觉下午去了,再玩儿个游戏就晚上了,再打电话说明天来不了,很多毛病。
那我们11点到11点半的时候打电话给他,中午要订了盒饭了,订不订?12块钱一份的,你要来我给你订,那学生想,盒饭不吃白不吃,就会答应你!
那总不好意思来就是吃饭吧,总得提前个半小时装模装样干点儿事儿吧。晚上再订个饭,好了,这个时间就守住了。这都是从自身体会过来的,因为你从学生过来你懂这些东西。
那会儿很困难,我们用11个月把搜索给发布出来。那会儿怎么省钱?没用服务器用PC机来搭,精力都耗百度上海代理在技术里了。搜狗发布出来之后,这是搜狐复杂系统里面一个上线当天就正常工作没崩溃的大型产品。
但毕竟跟百度还是有差距,但这个事儿作为起步的话,它的意义在于,给搜狐建立了真正顶尖的技术能力。现在我们的技术能力上是很好的,你看做客户端我们能干,搜索也能干。
2004年,搜狐开始讲技术驱动,因此给我们倾斜是不错的,薪水、待遇、股票比其它部门高。在2004年我没感觉,回过头看,发觉老张在里面含辛茹苦。
受Hao123和番茄花园启发,做成输入法
我做的第二块比较成功的事情,就是输入法出来,一个大变局就拉开了。
做输入法,也有它的偶然机缘在里面。我们做搜索到2005~2006年就非常被动了,就三年,技术人员热情消耗殆尽。2005年百度上市,上了之后气势如虹,股票价格高涨。
一般是新公司挖老公司的人对吧?FaceBook出来挖Google的人对吧?我们是反哺的。
我其他没有,但员工素质高这是有的,我们培养两三年的员工,不管是腾讯、百度,几个大公司,只要搜狗给了Offer或从搜狗出来的,很容易就过去了。
很可惜,搜狗这边要前途看不见,要钱没有百度多,就剩下一点点理想的东西,怎么支持这个事情呢?到2010年我们分拆的时候留下来的真是红军,是翻过雪山过了草地这帮兄弟,有革命理想主义的兄弟。
(*搜狗CEO王小川)
因此在做输入法之前的时候已经很被动了。然后,我们想做输入法,我们先做了一个产品叫工具条,我们一开始有感知,Toolbar(创业家i黑马注:工具条)跟搜索有点儿关系,然后就推工具条,工具条是带搜索量的,这个感知还比较早,但感到另外一件事情的时候,搜狐搜索的收入是逐渐下滑的,这时你的流量也好、收入也好都被百度拿走了。
搜狗,按照张朝阳的说法:飞机就开始摇摇欲坠要坠地了。
那会儿我们就想到了做输入法。做输入法的原因,从我本性里面,还是从技术想,你有什么生产力的能量能放进去,那时候我想到还是搜索引擎能够帮助去计算中国人的词汇是怎么用的,包括哪个词用的多,哪个词用的少,哪个词是新词儿,哪些是老词儿。
我们是活的,从搜索引擎中得到用户说过什么话,搜索了什么东西,到今天就开始,用户不仅说的是词儿了,句法关系,全部放进去了。
比如人名取名的规则,叫王建军,不是说把所有人名都能输下来,但我知道人是怎么取名字的,建和军放在一会儿就是建设的建,就不会是健康的健,百家姓的使用,这个输入法的使用,按照今天时髦的说法就是大数据,甚至云计算,机器里面的量永远不够,机器里面只有80M用来做输入法,否则你的计算能力太大,CPU绷不住的,但实际上要求它要有更大的能力怎么办呢?
放到云端,要做出判断,如果这个词儿如果从概率上来说小众了点,它不一定会在你机器里面那点儿存储,就要云端来计算,所以这是很复杂的语言模型。所以,在云计算、大数据,其实我们一直在用,只是我们从来没想喊这个事儿。
在创新里面,产品系列的讨论里面,我们有个小白用户,2%的输入习惯是我们收集的,按删除键就代表什么事儿,说明他输入的东西是有问题的不想要,那我们就会针对删除键来驱动你后面的改进,用一个闭环把所有用户的习惯进行改良,做的很深,它就不是一个草根活,是个高精尖的技术在里面。
今天的语言模型足够了,输入法只是做了一部分,语音识别这些东西比其它家都有优势,这一句话到底说了什么东西,从语音波形到拼音,从拼音转换成句子我们是有积累的,还有中间一些皮肤,这是我们把输入法给做成,这是06年发布的,中间07年跟Google还打了一架,Google抄袭我们词汇,Google第一次发布会改名叫谷歌,第二次发布会当天就炸堂了,被指抄袭,它确实词汇是用的我们的,不是他自己的。
Google在中国的品牌不错,所以会有人说怎么可能Google侵你权?你就是贼喊捉贼,我们至少输入法是在品牌上的一个破冰,是个好事。这奠定了专利地位,今年大家能看到我们在互联网专利里面,这是第一案。跟Google的这个官司引起了我们对专利的重视。
以前做的每件事情都有它的意义在,很有效。2002年,两个网站对我震撼很大,一个是hao123,第二个也是个草根的东西,番茄花园。之前不知道hao123这个网站,当时的情况是,我们当时技术部想做个事儿,想验证一下搜狐首页的流量怎么来的。
这很好算,服务器搜一下就知道点击,留有记录的,算出来第一名就是hao123,占了搜狐访问量的1/3。当时第一反应就是算错了,再算一次,因为你没听说过这网站,但算两遍还是它,最后就疯了,发现这个什么烂网站啊,密密麻麻摆了一堆网址,但就构成了中国上网很重要的入口。
之前觉得做这个事情是,页面要怎么设计,设计得怎么优雅,怎么调颜色,但人家放了一堆网址就成了hao123的模式,而且不只是一个网站,他的创始人李兴平做的其他两个网站,也是在Alexa排名很靠前的网站,真的很震撼,把你原来觉得很牛逼的,高科技精英的东西都摔的死死的,这就是个转变。
原来在地方上电信给你装了宽带之后都给你设了hao123,让你会上网,你不理解很多事儿,但不代表别人不这么干。
QQ上市之后股票才5块钱,为什么?华尔街那些精英分析师们从来不用这玩意儿,根本不知道它的存在,更不可能在上面分享东西了,股票长期低迷。所以,中国概念股在美国上市特有机会,因为美国人看不懂它,但美国股市有清晰的游戏规则,最后中概股股价还是会上去。
番茄花园,我们跟它有合作,2006年推出输入法之后的一年时间里,我们输入法已经非常好了,人见人爱,搜狗员工用着说好,用户给我们送锦旗的都有。
搜狗市场表现很好,搜狐也很努力地推,但一年下来我们市场份额才2%,那就很崩溃啊,这么好的一个产品,推了一年,才拿2个点的份额,要拿30个点得15年?就不靠谱了。
那么就想,用户怎么接触到你的输入法?听朋友说,还是从哪能下载到?那时候才懂得建输入法渠道部门。
之前搜狐是没有这个完整的渠道体系的。搜狐逻辑我把它定义叫百货公司逻辑。搜狐像百货公司,设很多频道,每个频道就是一个专柜,一层楼一个专柜,消费者到搜狐来,什么都有,因为你什么都有所以会有很多人愿意来,因为有人来马上就有人流,这跟百货公司是一样的。
但是,搜索其实不符合百货公司这种特点。比如要买可乐,你愿意买可乐去一个百货公司吗?累的要死,你肯定希望冰箱里就有,自动售货机里就有,小卖部就有。
搜狐已经很仁慈了,把这个可乐放在一楼专柜卖,在搜狐首页上卖搜索,那就是以前卖珠宝、卖化妆品的地儿卖可乐了,你还卖不出去,所以就会认为是产品不好。
后来我们搞清楚了因为用户不是这么用搜索的,用户用搜索就喜欢干净的页面,而不需要到百货公司去干这事儿。这时候我们就开始找番茄花园创始人,他帮了我们大忙。
我们也给他钱,成本是高,几百万的样子,但因为他,一年后我们市场份额到了40%,从2%到40%了,再一年到70%,中间还有很多原因,但这很重要。所以,除了产品,要理解渠道的力量。之前我们是不懂的,直到我们把输入法做成了。
搜索那会儿已经明白了,不可能比百度做得明显好,能做差不多就不错了,人家都已经习惯用的搜索凭什么再把他拎过来?所以,搜狗输入法的要求最后做到,Ctrl+Shift切出来,不是微软的、不是紫光的。搜索我们就明白了,要帮搜索找到渠道,我才有机会。
这是输入法从失败到成功给我的经验教训,我懂得怎么把流量带进来,但这个逻辑跟搜狐的逻辑是不同的。
搜狐是封闭体系,既没有流量流出,也不需要流量流入,搜狐的编辑不会到外面买流量,也不会在搜狐贴个链接,给钱都不做的,就自个儿玩儿。所以这个逻辑,对搜狐来说实际是离经叛道的事,很挑战搜狐原来根红苗正的文化。
这我就明白了一个事:如果只做搜索我们成不了,输入法要做好需要用户习惯的改变,我们就明白我们要做浏览器了,输入法带浏览器,相当于番茄花园的逻辑,浏览器带搜索就相当于hao123的逻辑。
狐狸的子宫里为什么能长出狗?
所以我做的第三件事做了个浏览器。
狐狸生下狗,我觉得还是有它的历史意义。
现在这个局面里面,大家看到的,搜索里面百度老大。除了百度以外其他三家,都应该按照搜狗这条路径来做搜索,360做到了,腾讯没做到,按道理它是最有机会做成这事儿。
2010年搜狗分拆的时候我就跟团队讲了,搜搜一定干不过我们,因为我对搜索是有深刻的理解的。
我能理解搜搜是怎么干活的他们挖很高薪水的人来做,不像我做是真想把这事儿做成,就跟富二代一样,一个孩子家里太有钱了,要啥有啥,你真能指着他在外面闯一番事业吗?这难度特别大,对吧?他只是觉得能跟老爸把钱要到手,这个事儿就能推动下去,反而他们的狼性和斗志都不够。
因此在2010年那段非常艰难时间,虽然我内心知道搜搜肯定搞不过我们,但你需要去证明这样一个过程,最后实际上也是证明了。腾讯是一个做关系基因的公司。
中国互联网有三大模式:一种是腾讯这样的,连接人和人,包括游戏也是;一种是连接人和信息,就是百度干的事儿;一种是连接人和交易,阿里干的事儿。后两种腾讯都没做起来,这有它的基因在里面的。
搜狐能走出搜狗来,我觉得还是来自它的媒体基因在这上面长出一个技术基因,这是基因突变,需要它(创业家i黑马注:狐狸)的子宫有足够的包容性,有极强的抗免疫能力,然后你才能在狐狸的子宫里面长出狗来。
但正因为这样,难度特别大,总以为它(创业家i黑马注:狐狸)能帮到你,你就有你的负担在后面,不一定是好事。离开搜狐的帮助,反而你自己获得这种斗志。跟人一样,你在家里永远依赖家里,还是要自己出去自己来。
搜狗的未来:工具服务化
搜狗三级火箭这个模式也有缺陷。
百度从信息服务的角度来说,它能帮你做选择,反而背后有商业性存在,有两个做选择的东西:一个是搜索,搜索敲个词之后你真的不知道你要的第一、第二结果是什么,它会帮你选一次,靠机器从互联网上数以亿计的网页里找到你要的东西,给这个给那个可能都对,甚至把广告加进去了。
导航现在构成360第一收入,在百度的收入构成里面也不小,这两个特点就是:它能帮你做选择,导航是靠人选的,搜索是靠机器选。
所以,输入法、浏览器如果还是工具,要能够帮你做出选择的话,你就得做三级火箭,你的可能性才会非常大。
但如果用户其实是需要你来帮助做选择的,因此我们现在的输入法、浏览器往下会做个大的升级,输入法首先升级,在做选择的时候还是以信息服务为核心,我们原来说浏览器对搜索产生了影响是因为它的渠道,因为一个搜索词先要经过浏览器的搜索框才能进到搜索里去,那么对不起,有一半的用户,甚至一半多的用户就会用我们的搜索引擎了,我们成了盖帽,就是浏览器成了给搜索盖帽的。还有一层盖帽就是输入法。
敲词首先要进到输入法,把输入法放到浏览器搜索框里面,回车键才能进到搜索里面去,所以原则上输入法用户输入的词,都是先经过第一道的。
如果在用户输入词的时候,就理解用户的意图,我直接给用户推送用户需要的结果,最后用户发现根本不需要把这词儿放到浏览器里面去,也不需要再进到搜索里去,就是输入法在用户那已经帮用户拿到他想要的了。
我们做购物搜索、网页搜索,还是你的wrod文档我们都从头到尾提供给你需要的,从需要变成获取。
因为输入法两个用途:一个是输入东西,非常典型的在微博里面、在论坛里面,写wrod、写PPT,目的在这儿;但输入法还有个很大的目的是获取,它是用户交互界面第一道闸。
所以,我们现在有能力很精确的识别用户在什么环境下你想要什么,那我就有机会服务你,就不需要经过浏览器再搜索了,直接就可以帮你做选择了。我们发布新的输入法,叫做有智慧的输入法,因为帮你做选择是靠智慧的。
但我讲,从这个开始就打破三级火箭了。输入法从第一级火箭里就可以直达结果了,不用通过搜索引擎,就把你要的网页和广告就给你了,既不通过浏览器也不通过搜索了,这件事情做出来对行业里一定是个挑战。
第二步,浏览器也会从工具向服务转化,当你输入个链接的时候,你的目的并不只是看这一个页面,比如当你看新闻的时候,新闻的来龙去脉,跟新闻延伸的兴趣,相关的百科解释,新闻中提及的歌或者电影,我在浏览器里都可以直接让你去消费,我会帮你做选择。
浏览器直接连接起来,而且都不经过搜索引擎了,也不走搜索引擎相应的模式,一到了页面给你推荐相关的东西,相关的音乐、相关的图片、相关的视频,浏览器也变成服务了。所以工具服务化,它们的价值就像网址导航和搜索一样。
我们就从三级火箭模式解脱了,解脱之后我们用户量就能充分爆发出它的商业意义来,爆发出对用户的增值来,否则你的用户量受制于三级,总是发现你比比其他家小,从用户量其实我们比百度大好多,比腾讯来讲小一点,但腾讯还会越来越大,但我认为这样一下就进入真正的主战场了,就不是靠搜索去打仗,是靠浏览器、输入法打仗,形成模式。
搜狗演变的逻辑
搜狗的这种演变有几个价值观的东西在起作用。
一个策略叫做智慧的体外进化,这跟我们的产品其实是有关系的,体外进化这词儿是最近一年谈的比较多的。我的说法是,前5000万年人的进化是靠体内进化的。你要冷了怎么办呢?
那你就长脂肪、长毛,但最近5000年不是这么进化的了,你冷了后穿衣服、开空调,所以人对自然界的适应和改变能力,已经不是靠自身的蛮力去进行了,我们以前是靠跑的快、体力好,现在开车一脚油有去了,以前靠耳朵好使,现在靠手机就能联系,顺风耳,电视机或者电脑可以当做千里眼,包括现在这些设备都是在体外进行的,不是靠你体内进化的。
那么,在体外进化这是个大的趋势,技术自己是有生命的,开始是技术驱动人去做事情,但到了一个阶段的时候,技术它自己会驱动人去适应它的,机器最终也会有它的生命在。但现阶段,因为它和你合体了,你变得更强,今天人离开了技术、离开了这些工具之后,你会变一傻叉了,什么都不会。
所以你要靠体外的东西帮助你才能更强大,互联网人变得更强大是因为有东西跟着你一起在工作。那么为什么叫智慧的体外进化呢?
最核心是在智慧上,今天的像Google,离开Google之后我们很多事儿,对很多人来讲,他就不懂了,你需要Google才能回答很多问题,才能解决社会中的很多事,人的智力也已经跟外界这些合在一块了。
所以,如果我们能在这个领域里明确我们的目标,是在智慧层面做出更多的服务、工具来帮助到你,那我认为这件事情符合未来发展趋势。
我们怎么做出更聪明的机器来让你去使用。而我刚才讲,它帮你做出信息选择,是一种智慧,我能帮你选好,你要这个、要那个,人其实都愿意的,除了顶尖智慧的人以外,很多事儿都是愿意其他人帮你做选择的,这是个现实,大多数人其实离开了信息是越来越白痴的。
因此,我们的目的是在做智慧的体外进化。
智慧怎么来?你机器凭什么有智慧?这个命题其实之前已经有些解开了,所谓智慧的定义,有一个定义叫做普林特式,普林特式指的是一个机器坐在你里面,它能和你对话,你是分辨不出它是人还是机器来的,那么它就是这种仿人的智慧了。
我们分几个阶段看,如果我们用一个有点强词夺理的说法讲,把QQ和整个互联网放在一块,它是有智慧的,它可以对话啊,只不过是QQ的软件把互联网连在一块了,脱离互联网QQ也是没智慧在的。
后来看了一个电视连续剧,叫《黑镜》。英剧,就是讲一部机器,把你在FaceBook上拎起来,它就变成能跟你对话的智慧的东西了,智慧不一定非得做个人,它可以在互联网上把一些行为逻辑聚在一块就变得聪明了,因为它是把整个互联网的东西全部聚在一块,它也会很有智慧的。
Google就是一个典型代表,Google的搜索引擎敲个词儿进去,就会给你结果,它很聪明,不是Google的工程师聪明,而是Google懂得怎么在互联网上把信息的智慧提出来。
以前技术的研究是,页面里面标题怎么写的,正文怎么写的,每个词出现多少次,以决定这个词跟这个文章相不相关,Google在这个逻辑之外,如果一个页面能够链接到你,你意味着重要,如果链接到你,里面说你是有什么属性,那么就会知道跟这个内容是不是相关。
否则,如果没智慧的话排第一名的就不是搜狐网站了,而是一个网页里面标题里面写了十个搜狐,正文里面也全写了搜狐,这是最相关的。那这个链接的编写和里面标题的关系是有人存在的,人在里面留下了很多指引的智慧在,提出来把它放到产品轴去,这跟现在讲的大数据是一样的。
所以我们也看到一个事儿,第一我们要做智慧的工具,智慧的体外进化就是我们干的活,怎么来?在互联网渠道挖,输入法就是挖了一道,把人怎么说话的逻辑挖下来了。
虽然不能挖出对话来,但至少你在把拼音拼出来的时候我已经知道你想要什么了,这是输入法干的事儿,浏览器也是,当你看到页面的时候推荐其它页面给你,怎么办呢?
我们看其中一些领先的人,愿意高成本消费的人,看到页面发现搜不出什么东西来,他就把浏览器当页面了,最后能学习到,靠人的智慧挖,使浏览器从工具向服务转化。信息选择能力的智慧是来自于互联网的人的,我们叫做智慧的互联网,或者互联网智慧,是这样的逻辑。
有了智慧之后,人就会利用工具帮你做信息选择,应用工具享受服务,尤其是输入法这样的产品。
这条清晰的脉络是我们主导的,搜狗是什么呢?搜狗未来想把智慧概念连接进来,帮你做选择,能让你的选择更简单,能让你变得更强大,使你体外聪明的机器能够帮助你。