标签: 搜商训练计划

  • 千亿中选出10个,只需1秒,搜索引擎为什么这么快?

    千亿中选出10个,只需1秒,搜索引擎为什么这么快?

    小众、高效的搜索引擎

    👉 无广告 | 小众搜索 | 10倍效率

    互联网上有上千亿个网页,通过输入一个关键词,搜索引擎却能够在1秒不到的时间返回搜索结果,且无论是搜索网页,还是图片、文件、视频! —— 为什么如此之快?

    搜索引擎
    用时0.44秒

    有人说因为这是计算机啊,又不是人,当然快…

    也有人说因为他们是大公司,有很多服务器,技术牛逼呗,速度当然快…

    但这并不能解释,为什么同样拥有强大服务器和技术的微软操作系统windows上搜索一个文件的却要很长时间。难道你的操作系统上的文件超过千亿个吗?

    搜索引擎公司确实有先进的服务器,这些机器也能够在一定程度上提供速度支持,但并不是解决“千亿选10个,只用1秒”的关键。

    实际上,真正想要快速响应,关键是能够快速发现互联网上的网页并找到这些网页的“偏旁部首”,进而像查字典一样找出一张张网页来。 —— 没错,就像新华字典一样

    1. 快速发现互联网上的网页 —— 快速搜集
    2. 找到这些网页的“偏旁部首” —— 快速查询

    一、快速发现互联网上的网页

    今天互联网上我们看到的所有信息都是以网页形式出现的,无论是浏览器中看到的有清晰网址的网页,还是app中看到的一个一个的界面,背后都是网页,网页上可能有标题,有段落,有视频,有音频等信息,这些就是用户能搜索的所有信息源了。

    互联网发展至今,已经累计有上千亿的网页,怎么收集这些网页信息? 这个部分就是爬虫的工作,我们熟悉的百度,google,360,搜狗等搜索引擎都有自家的爬虫,这些爬虫分布在全国各地的服务器上,日夜不停息的从互联网上抓取网页信息,然后保存到自家数据库,提供用户搜索服务。

    当然搜索的工具不仅仅只有搜索引擎,比如现在比较火的社交媒体,如知乎,微博,小红书,微信等等,这些平台自身当然会存储这些信息,用户发布的文字(回答,笔记),视频(长视频,短视频),音频(音乐,教学)等信息就直接进到数据库中了,每个平台也有几个亿的网页信息提供用户搜索。

    简单来说,信息要么就是从互联网上爬取放到自家数据库,要么用户发布后就直接在数据库中。

    二、到这些网页的“偏旁部首”

    这就像在人海茫茫中,找一个灵魂伴侣一样,那有这么容易?搜索引擎尽然能在1秒内把可能对你有用的信息放到你面前,背后一定有一套完整的解决方案,才能实现快速响应的。

    其实原理就和新华字典一样

    新华字典 拼音音节 索引表

    你看呐,我们并不会从新华字典第一页翻到最后一页,一页一页找,从几万字中找到你要的那个字。我们的搜索过程是这样的:先查看索引表(拼音或偏旁部首),然后直接翻到该字所在的页,直接就找到了对吗。

    搜索引擎也有一张自己的索引表,这张索引表也可以用拼音和偏旁部首吗?算一算就知道这个方案不行,互联网上有上千亿个网页,拼音+偏旁部首 撑死也就是几百个,每个需要承载的网页数量依然几个亿的数量级,依然太大了。怎么办呢? —— 用关键词来当索引表

    将几千亿的网页分类到几万个词语上:

    1000亿 / 10万 = 1百万

    这个量级,今天的计算机很容易处理的过来了。因此,搜索引擎最终采用了词语作为互联网的索引表,即用词语来给网页进行分类,大大提升了搜搜的效率。

    关键词搜索 清华 python 课程

    巧了,用户也刚好是用词语来搜索信息的!

    总结

    今天互联网上的信息已经是千亿级了,网页的数量在不断增加,网页当中的文字、图片、视频、音频等信息也越来越丰富,信息也越来越容易被搜索到。这些信息最终都会以词语的形式进行分类,文字内容通过分词之后变成一个一个的关键词,图片、视频、音频也可以通过各种各样的技术手段文字化,在同样按照词语的形式进行分类。 —— 关键词才是搜索引擎速度的秘密,它是互联网这个“新华字典”的“偏旁部首”

  • 为什么『信息获取方式』会影响一个人收入、学历、阅读能力?

    为什么『信息获取方式』会影响一个人收入、学历、阅读能力?

    小众、高效的搜索引擎

    👉 无广告 | 小众搜索 | 10倍效率

    在信息泛滥的今天,很多人面临一个问题:如何利用信息来解决实际的问题?

    虽然社交媒体上已经充斥着各种各样的信息,工作、学习、生活、娱乐,应有尽有,并且在大数据的背景下,信息变得无比聪明,各类平台都拥有非常智能的推荐算法,总能把你关心的内容放到你面前来,供你享用,但真正遇到实际问题的时候,这些信息好像又不是那么灵了。

    为什么会这样?

    因为今天大家并不缺信息,而是缺乏提取信息的方法,本质上人类从古至今只有2种获取信息的方式,即搜索和关系网络。不妨思考一下:在古代的原始人如何解决某个问题(比如:食物短缺)

    • 方法1:主动去森林当中探索,直到发现食物为止
    • 方法2:问问其他部落的人,在哪里能找到的食物

    请再思考一下:在今天我们是如何解决某个问题的呢?(比如:如何学习英语)

    • 方法1:主动去搜索引擎中搜索信息,可以是百度、google、微信、知乎、小红书、英语学习社区等等,去找到关于问题的答案
    • 方法2:问问一个已经在英语方面很专业的人,这个人可以是领域大V,可以是英语老师,可以是某一个自己信任的朋友,甚至你也可以直接在某个微信群里发问,直到得到一个满意的答案

    发现了吗?解决问题的方式,从古至今其实并没有发生本质上的变化:

    • 过去:去森林找寻食物 → 今天:在搜索引擎搜索“英语学习技巧” —— 搜索
    • 过去:问其他部落 → 今天问领域大V,老师,朋友 —— 关系网络

    只是今天这些方式变得更加智能,我们有了搜索引擎,有了社交媒体平台,有了知识问答平台,有了人工智能,有了推荐算法,有了机器学习,有了神经网络…… —— 但本质并没有发生变化

    你以为只有人是这样吗?

    不仅仅是人在用这两种方式在寻找信息,就连人工智能也是相同的原理,来帮你获取信息的,并将获取到的信息喂到你的嘴边:

    可能大家不知道的一个事实,很多大厂都会购买用户行为数据并结合自身的数据,再拿去训练平台的算法,而这其中一个重要的数据就是输入法关键字,因为它几乎是每一个网民每天都必然会接触到的工具,没有什么比它产生的数据来的更直接。你是否有这样的经历,刚刚还在和同事讨论XX话题,一会去刷社交媒体平台的时候发现已经有相关的信息推荐到你面前了,甚至有时候你只是哼唱了一段旋律,就会有相关背景音乐的短视频推荐过来。 —— 其实你早以把关键信息输入给了人工智能算法,本质是还是你在主动搜索信息,只是这个过程变得更微妙,更不经意。

    • 你朋友点赞过的信息,会推荐到你的面前
    • 你关心过某个大v,就会有相似领域的大v推荐给你继续关注
    • ……

    这些本质上是都是利用了搜索和关系网络

    你看,无论是过去还是现在,无论是智能(人还是人工智能,寻找信息的方式都是搜索和关系网络

    谁更重要呢?

    既然今天信息如此“聪明”,我搜不搜,信息总会出现在我的面前,那是不是不搜更爽?当然不是。

    有研究表明,善用搜索的人比其他网民的收入更高,学历更高。

    从收入角度来看,搜索用户收入水平相较全体互联网网民收入水平偏高。全网个人月收入8000元以上为14.8%,搜索用户8000元以上占比约45%。搜索用户近四成家庭月收入在2万元以上。同时个人与家庭消费居高,超五成用户个人消费在 4000元/月以上。

    搜索用户特征

    既然人工智能算法能把相关的信息推荐给我,那搜索不搜索又有什么区别呢?为什么会搜索信息的人无论收入还是学历都高于普通网民?这两件事儿怎么会相关呢?

    信息推荐与搜索信息

    很多人都知道抖音、微博、小红书等社交媒体“有毒”,一打开就停不下来 —— 因为你担心错过美好生活

    这些平台背后的人工智能不断的在给你推荐你感兴趣的内容,并以你付出的宝贵注意力作为核心指标。 —— 如果一个平台能每天占用你2小时候以上,那它最后多半能上市

    • 你关心的才是头条 —— 你关心的就会一直是头条
    • 抖音记录美好生活 —— 忘记美好生活
    • 小红书标记你的美好生活 —— 美好生活
    • …. —— 感受美好生活
    • … —— 引导美好生活
    • … —— 美好生活解决方案
    • … —— 美好生活从这里开始
    • … —— 美好生活品鉴官
    • … —— 遇见美好生活
    • … —— 相约“诗和远方” 惠享美好生活
    • … 美好生活

    这些信息推荐的结果是什么呢? —— 2022国民专注力洞察报告显示,当代人连续专注时长仅为8秒查看完整数据报告

    社交媒体平台有系统的注意力捕获机制,游戏平台也有系统的上瘾机制,它们本质上是占用你的时间,并非帮助你解决实际问题。

    你也许收藏了非常多别人的种草内容,比如小红书上面有各种种草信息(10个英语学习网站,8个你不知道的excel技巧,自媒体人不得不收藏的100个常用工具,10年广告人分享的8个标题写作技巧,豆瓣top250高分电影,有了这个5个工具再也不愁XXX,明星们都在使用的减肥食谱盘点,100页PPT模板XXX,自媒体工具大全,数据分析必备技能,打工神器(有了它以后再也不加班)……)

    因为这些都是算法投喂给你的信息,并不需要你太多的思考和过滤,只要你舍不得扔掉,只要你担心会错过什么,它们就会进入你的收藏夹。但大多数时间,收藏夹都是用来吃灰的,不是吗?

    搜索有什么不同吗?尽然会影响收入?

    人第一次密集接收信息推荐是什么时候?—— 含着奶嘴的时候。刚刚睁开双眼,发现世界的时候!

    哪时候任何信息都可以算是美好生活,哪时候不需要思考,只需要全盘接受。但当你问出第一个问题,并向从这个世界获得答案的时候,思考就开始了 —— 天空为什么是蓝色的?

    搜索是一个学习和解决问题的过程,这个过程中有一个非常重要的思维 —— 聚焦,这和信息推荐是完全相反的

    搜索就是在聚焦信息,你会下意识的过滤很多的信息,而把宝贵的注意力放在最有效的信息上(当下你面对的问题,任务),你会不断进化搜索关键词,不断聚焦问题的关键,不经意间养成了独立解决问题的能力。

    你可以做一个小的实验观察:

    观察一下你的父母怎么使用搜索引擎关键词的?如果他/她是第一次用百度,那就更好了,你大概率会看到一个完整的搜索进化过程。你告诉他“找下哪里可以看鱿鱼游戏”,然后认真观察他的每一个搜索词。(请不要给任何的提示)

    接下来的情景多半类似这样:

    1. 第一步:输入“电影网站”,发现很难找到
    2. 第二步:输入“鱿鱼游戏”,发现有相关信息了
    3. 第三步:输入“鱿鱼游戏 韩剧”,发现更相关了
    4. 第四步:输入“鱿鱼游戏 在线观看”,最终找到了答案(虽然国内搜索引擎非常难找到)
    5. 以后:直接搜索“XX电影网”,找电影就上XX电影网,记住了
    6. 再以后:从收藏夹直接打开XX网站

    当然也可能搜索一些带疑问的关键词,比如哪里可以看之类的。这就是一个完全不懂搜索引擎怎么用,甚至是第一次使用搜索引擎的人,大概率都会出现的情景,他们在不断聚焦信息,不断过滤信息,他们在不断准确的描述一个问题,不断从得到信息中进一步提炼信息,最终找到答案(解决问题)。

    当然,这个例子可能非常简单,关键词的进化过程、解决问题的过程也非常容易观察,非常的线性。

    结语:

    了解了搜索和推荐的本质,反观一下自己平时获取信息的方式呢,去整理整理,归类归类!你是更习惯于主动搜索信息还是利用关系网络获得信息呢?或者只是被动接收信息推荐?你每天能集中注意力的时间有多长呢? —— 一个简单的方式就是打开手机观察一下屏幕使用时间,再统计一下你最近一周完整看完过多少篇500字以上的文字内容?最近一年完整阅读过多少本书籍?(当然一定是你感兴趣的)

    • 人们不愿意回答一个简单到触手可及的问题 —— 因为这会浪费他人的注意力 —— 不如你先搜索一下?
    • 我们只会回答大爷大妈下一站到哪里,即使就在公交站牌前。但年轻人问这样的问题,一开口就心里也许就开骂了(“特么的不识字?”)
    • 我们其实并不反感大爷大妈,只是反感提前变成了大爷大妈 —— 尤其是今天的 “互联网大爷大妈”

    sougood 会慢慢丰富整个搜商训练系列的内容,之所以叫训练,是因为它不可能短期习得,真正变成技能一定是需要时间的。搜商从0到1,再从1到100,你的学习能力和解决问题的能力也会不断提高,你的注意力也会比普通人高。

    搜索能力是人与人之间逐渐拉开差距的一个隐式技能,它看似不起眼,却重要到形成了一门专业的学科。信息的搜索可以简单到找一部电影,也可以复杂到了解一个垂直领域。