14亿人的生活琐事,正在变成“永不枯竭”的石油
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
数据可以模拟飞机飞行,仿真汽车碰撞,不用搞真实的实验,缩短机械开发时间; 数据可以训练机器人,让它们闲时端茶递水,忙时抢险救灾; 数据可以预测故障,无论是风雪中的高压输电线还是数据中心里娇贵的硬盘,都能在损坏前一刻被察觉替换; 数据可以模拟你的声音,复刻你的脸,甚至猜出你自己都未曾留意的爱好; 数据还能帮企业调整进货卖货的节奏,安排不同产品的生产顺序。。。
如果你开了一家连锁奶茶店,把“进货”、“库存”、“销售”数据放在这套系统中,系统就能明确告诉你的采购部门,下个月大概能卖出多少奶茶、多少冰沙、多少冰淇淋,各种原材料分别进多少货最合适; 你把光顾过奶茶店的用户信息、购买记录输入这套系统,系统就能告诉你的营销部门,这10086位顾客是咱们的忠实顾客,发优惠券返利给ta们,肯定能处成老铁; 如果把财务、绩效、人力数据放进系统,它还可以告诉你的人力部门,那个每天早来晚走老板们都喜欢的小刘其实是故作勤奋的“卷王”,那个每天低调按时上下班的小李才是真正工作做得好的人,应该给他发奖金。
假如中哥我想买T恤,我就会上百度搜索“T恤”; 然后百度就给出一堆推荐其中就有阿里巴巴的商品链接(这就是阿里花钱投的广告); 我点进去,就有可能购买。
1、把能找到的方方面面的数据,有一个算一个,全都汇总在一个系统里; 2、然后为各个搜索引擎里20万个关键词的“效率”高低打分。由于是用计算机操作,不受人手限制,所以打分能做得很细致,相当于牧羊人对每只“羊”都能照顾到; 3、接下来,系统就自动投放广告,根据返回的效果,再修正广告投放的操作。如此反复。
原来数据里蕴含了这么大的能量!
1)在远古时代,先民们就发现了黑乎乎的石油,他们也知道利用石油,只不过利用的方式是直接点燃,取暖照明。(烧石油带来的便利还不及燃烧放出毒气的伤害大。。。) 2)而在近现代,人们建设了油田,自动化抽取石油;还建立了石油精炼厂,可以做成汽油、柴油,还能做成肥皂、化纤、塑料。 这两种都是对石油的利用,但他们是一样的吗?
一个用户是从哪个搜索引擎来的; 他来了淘宝之后待了多久; 点击了啥; 有没有下单; 没下单的话,是到了哪一步退出的; 下单之后又看了啥,买没买; 诸如此类,很多很多。
要想完成大数据计算,必须先搞一个“数据仓库”,在里面安装各种机械臂、传送带,再养一堆数据搬运机器人,相当于用代码搭建出一套质量极高的“自动化数据治理系统”。 最终目的就是:想要找啥数据就能找到啥数据,想要算啥数据就能算啥数据。 这就是数仓。
普通人看到阿里巴巴的成功是源于对梦想的执著和一次次准确的商业布局; 而咱们看到的,却是这家集团背后如圣火一般燃烧不断的数据。(包括今天阿里最为人熟知的计算力系统阿里云,最初就是为了大数据计算而设计的,这个故事我写在了《阿里云的这群疯子》里,有兴趣的浅友可以去看。)
在2004年,数据可是“稀有矿产”,阿里巴巴是国内为数不多的拥有“数据油田”的地方; 可是到了2016年,其他企业也开始效仿,无数互联网App如遍地烽烟,传统金融、零售企业也开始在网上撩客户,眼看他们手里的数据也越来越多。
1、如果大大小小的公司都有了数据能力,那不同企业的数据就能用某种方式联合起来计算。这样的联合,绝对不是“1+1=2”,而是“1+1=10”的节奏。 2、就像全世界只有5个人有手机,那他们只能相互打电话自娱自乐;但如果普惠到14亿人每人一部手机,就会催生微信、美团这种之前完全想象不到的新生态。
第一层,是“数据平台”。 这个数据平台,就是我们上一章说的“数仓”。分散存在好多系统里的数据,需要一个“数仓”连接起来,统一调度、管理。 无论神马企业都需要这个基础设施,所以“数据平台”是必选项,它就像一个王冠。
第二层,是“数据应用”。 在数据平台之上,每个企业想要做的事儿就不一样了:比如有人就想要从自己的用户里找到适合发优惠券的人,比如有人想要看看自己进货销货的过程中还能不能节省点资金占用,等等。 能完成这些五花八门的事儿的系统都叫“数据应用”。 就像你我都有手机,但里面装的 App 可是各不相同,有人爱用拼多多,有人爱刷抖音,有人爱上陌陌。。。 所以,“数据应用”肯定会因人而异,是选装的。它就像王冠上的珍珠。
搞技术、没啥情商、在复杂的公司活不过三集。
中央厨房向下,连接萝卜、白菜、西蓝花、茄子、扁豆、西红柿、猪牛羊肉等等几十样原料; 中央厨房里,利用大规模的工人分工和机械化加工,用最高的效率生产出半成品; 中央厨房向上,连接各个饭店,饭店。他们拿到半成品,只需要简单加工就能做成可口的饭菜,送到千家万户。
数仓向下,连接各种数据库,用户数据、销售、仓储、财务、人事等等几十个数据源; 数仓里,利用高效的计算逻辑,把底层数据计算成半成品,例如把数据分好类、打好标签,做到“洗净待用”; 数仓向上,就连接各种数据应用,数据应用在“半成品数据”的基础上,只要简单的计算,就能快速得到结果。
1、想要针对它的用户中“住在一线城市”,“年龄30-35岁”,“过去30天曾经在线下店购买过商品”,且“过去30天没有在线上购买过商品”的“女性”来发放优惠券。 2、如果这位顾客过去曾经购买过1000元以上的单品,则向她发放200元优惠券;如果这位顾客过去没有购买过1000元以上的单品,则发放100元购物券。
消费者域:消费者的数据; 商品域:商品的铺货、补货、调货数据; 生产域:生产原料的“进销存”、供应链管理数据; 财务域:公司的财务数据; 人效域:员工绩效、工资数据;
所以,一定要用“平台思维”来做数仓:把各种可能的逻辑都准确抽象出来,做成模块,然后组合调度。
你可能想不到,它们单单客户的数据,就来自七十多个系统,比如天猫、京东,还有官方电商网站,还有公众号,还有客服系统、导购系统、POS机刷卡数据等等。这些数据质量都很高,但就是太分散。 每次要做活动,就从存在不同机房里的几十个系统里挨个“捞”数据,把捞到的数据存在一起,然后写脚本代码进行打标签,然后才能把标签数据输出给业务部门去设计优惠活动。 这样一下搞下来,一般需要两个月时间。 问题是,如果下次再搞一次促销,还要重新从数据库里捞数据,写脚本,还得两个月时间。。。
一号坑:数据工程师的人工成本非常高,干这种数据整理的活儿用数据工程师,那简直就是高射炮打蚊子,浪费钱。 二号坑:这么来一次就两个月,臣妾真的等不起。。。你一次促销还没搞完,竞争对手可能都玩了三次促销了。
从数据里分析出来的结果一般精确,就像炼出了“93号汽油”; 从数据里分析出来的结果极其精确,就如同炼出了“98号汽油”。
第一,当时美国同类型的数据智能公司已经有50+家,眼看要变成红海。 第二,在中国,还没有人布道“增长黑客”的概念,赛道内同类公司的数量几乎是0。
在没有数据分析的情况下,商家也不可能不营销(不营销就死翘翘了)。 那时他们会采用无差别的营销,就是对所有消费者都推荐产品,这样必然会打扰那些不想买东西的人; 但有了数据分析,商家就可以精准地对需要某个东西的消费者进行“提醒”或“促销”,这样的结果是:想买东西的消费者不会觉得被侵犯,反而得到了优惠;不想买东西的消费者也不会被无端打扰了。
品牌方和线下零售店都可以通过小程序来开发自己的购物页面,人们能从页面上下单,也可以添加商家的企业微信。这样一来,品牌方和用户直接建立了联系,也能把数据回收,用于促销和服务。(这就是人们常说的“私域流量”)
那年春天,连着好几个月都是“0新业务”、“0回款”。
有点像拍电影不NG,没机会给你反复揣摩,必须一条过!
说实在的,之前我确实没有操心过公司账上有多少钱,投资人笑话我是“老干部下海”。 疫情之后,我要求财务每周都向我汇报公司财务状况,成了真正的 CEO。
我发现我们和 GrowingIO 的文化特别契合,都想让数据成为未来的石油,都想让大大小小的企业用到普惠的数据智能。
如果从商业并购的角度,总会有机会花更少的钱完成并购。但少花一点钱根本不是目标,把事情做成才是我和 Simon 的目标。 既然定了要兵合一处,那早一天合并,就能早一天心无旁骛地一起出发。这样反而是更好的结果。
我们各自能发挥长板,当然比以前更开心!
可能创业也是这样,你不可能有地图,最多只有一个指南针。你不能指望所有的路都走对,但只要朝着正确的方向,你总能到那里。
作为一个网友,我真心为他高兴。因为他是有技术梦想的人,我能感同身受。 我们自己在数仓领域坚持了十几年,无论多难也没想过离开,因为这就是我们的热爱。现在数仓热了,难道我们不该成功,不该赚大钱吗?
从历史中,你可以看到一个国家的命运逻辑。就拿德国来说,他们的制造业天下无敌,所以在软件领域才能出现 SAP 这样的顶尖公司。 所以,中国之所以有我们这群人,是因为我们国家拥有世界最强大的数字商业系统,每个中国人每天都在为数据这种能源贡献力量。
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
评论