登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
大数据时代的数据收集与分析
在数据收集和分析这一正在繁荣发展的行业中,吉拉德-艾尔贝兹可能是最具影响力的投资者,他试图找出世界上的每一个事实,并将这些事实都容纳在被他称为Factual的公司中。自2008年创办以来,Factual已经吸收了大量的事实,其计划是为相互之间联系紧密的数千个超计算云建立全球范围内最主要的参照点。以下是这篇文章的全文。
在数据收集和分析这一正在繁荣发展的行业中,Factual创始人、此外还对其他30多家创业公司进行投资的吉拉德-艾尔贝兹(Gilad Elbaz)可能是最具影响力的投资者。
在7岁大时,艾尔贝兹曾写道:“我希望成为一名富裕的、非常聪明的数学家。”原因是,那将帮助他“发明时间机器、机器人(16.990,-0.56,-3.19%)和能回答任何问题的机器之类的东西”。
此后的34年时间里,艾尔贝兹已经完成了许多的目标,他已创造了能穿越网络的软件机器人、为谷歌(微博)回答了一些非常重大的问题,并在这一过程中获得了远远超过百万富翁的财富。
但是,他的时间机器计划则已被抛弃,原因是其发现了更加重要的事情,那就是试图找出世界上的每一个事实,并将这些事实都容纳在被他称为Factual的公司中。
“世界是一个大数据的问题。”艾尔贝兹在这家公司的总部中说道,这是一间安静的办公室,比洛杉矶乡村俱乐部高14层楼。他身形纤瘦,说话温和,当有什么想法让他感到激动时,他会在椅子中不停地摇动身体。“如果能在一写下错误的东西时就能马上发现,那将会怎样的一种情况?Factual肯定会是改变商界的新事物,对计算来说也是一种宝贵的新工具。”
在“大数据”蓬勃发展的这个年代里,曾经是难以想象的数量庞大的信息正在汇聚起来,从而创造出足以改变世界的发明。而在这一领域中,艾尔贝兹可能是最具影响力的发明者和投资者。除了Factual以外,他还对30家创业公司进行了投资,其中包括旧金山的一个致力于“大数据”的企业孵化器。Factual的总部位于星光大道的一幢高楼中,艾尔贝兹在这里主持召开研讨会,希望在洛杉矶地区培育一个数据社区。
艾尔贝兹还是其母校加州理工学院理事会的一员,同时还是X Prize Foundation基金的成员,这个基金会向在太空飞行、医药和基因科学等领域克服难题的团队提供现金奖金。艾尔贝兹出售给谷歌的公司Applied Semantics是谷歌旗下AdSense业务的基础,这项业务每年都能给谷歌带来接近100亿美元的营收。
虽然艾尔贝兹的投资额十分庞大,而且对前景的展望也很有价值,但他仍相对鲜为人知。他是如此的不爱出风头,以至于当最近他在参加一次有3000名数据科学家参加的会议时,仅有他投资的一家公司的几名职员认识他。他与曾经是联邦检察官的妻子和三名子女住在西好莱坞的一座乡间别墅中,一家人过着安静的生活。在个人兴趣方面,他喜欢在当地的一家运动俱乐部中打篮球。
艾尔贝兹说道,他的精神和金融资产就像是他需要分配的礼物,从而让世界变得更加美好。
“如果所有的数据都明晰无误,那么从世界扣掉价值的人就会减少很多,”他说道,“而为世界增添价值的人就会增加很多。”
创造明确的、可靠的数据还能让Factual成为一家规模很大的公司。
“艾尔贝兹远远领先于我们其他人,对于这位企业家所说的每件事情,我都要过几分钟才能理解。”通过麾下公司Andreessen Horowitz为Factual提供支持的风险资本家本-霍洛维茨(Ben Horowitz)说道。“在三年以前,他认为Factual是改变世界的最大机会。而随着时间的推移,世界已经朝着他所预料的方向发生了变化。”
自2008年创办以来,Factual已经吸收了大量的事实,用艾尔贝兹的话来说,就是“我们已经收集了数百上千亿的个体事实”。
Factual不仅向大公司提供数据,同时也面向规模较小的软件开发商,这些数据中包括可用的政府数据、以兆兆字节为计量单位的公司数据、以及全球50个国家的6000多个地方的信息,每一条信息都有17到40条的相关描述。Factual用30种不同的方式对80多万个餐馆加以描述,其中包括地址、所有权以及食客和卫生组织的评价等。此外,这些数据还包括5亿个网页的信息、一份美国高中列表以及美国180万名医疗保健专家的办公室所在地、特长和保险偏好等,还包括1.4万种葡萄酒的列表、从1950年到1974年的军用飞机事故、以及大型庆典活动的参加人数等。艾尔贝兹指出,即使是奇特的事实也会有用处。
在靠近Factual总部的地方,艾尔贝兹储存着500兆兆字节的数据,这大致相当于整个国会图书馆所需数据量的两倍。在亚马逊(微博)庞大的计算机云内部,他还存储着更多的数据。他领导下的统计员们对大量的数据进行了收集和清理,用来说明很多事情,比如说卫生部门在对卫生设施进行评分时的差异性、“中学”这个词汇在某个特别的镇上意味着两年还是三年的时间、以及原始数据及其副本之间是否存在修正等。
Factual的计划是,为相互之间联系紧密的数千个超计算云建立全球范围内最主要的参照点。到今年底为止,数字世界的数据总量预计将会达到2.7泽字节(一泽字节相当于一万亿GB),大约相当于7000亿张DVD的数据容量。Factual目前的员工总数为50人,当世界开始增长,以及这些数据库开始互的情况下,这家公司的价值将被证明是极其庞大的。
Factual按浮动价格向公司和独立软件开发商出售数据,其依据是有多少信息被使用。小规模的数据提供是免费的,而最大型客户需要支付的费用则会达到成百上千万美元。在有些时候,Factual还会与其他公司进行数据交易,目的是扩大自身所占有的资源。
就目前而言,某些客户使用Factual的数据是为了向手机地图加入餐厅地址等信息,或者是为了规划销售战略等。但Factual的真实目的则要更加广泛,直指当前时代一项重大业务的核心,那就是利用所有基于云的数据和算法,来找到自然和社会的模式,供科学家加以观察,同时供商界加以开拓。
“数据一直都仅被视为计算的副作用,一种当你工作时用来查阅的东西。”艾尔贝兹说道。“而我们将其视为一个完全独立的层面,是每个人在希望解决问题时都不得不去挖掘数据的层面,但你自己可能没有所需的完全可靠的数据。”
举例来说,一个餐饮连锁运营商可利用Factual来找出一个新的选址是否靠近竞争对手,以及当地人在社交点评网站Yelp上如何谈论这个地方。查阅餐厅附近的加油站数据可以知道有多少辆汽车会从高速公路上开下来,运营商还可利用Factual来看看自己的餐厅在网络上的哪些地方被提及,或是纠正其他人所说的有关餐厅的情况。
Factual拥有来自于多名硅谷明星级人物的2700万美元融资,目前仍是一家封闭式持股的公司,但却已经有了成千上万的客户。Facebook、CitySearch、AT&T及其他一些公司都会使用Factual来获得有关某些地方的信息,《新闻周刊》则使用数据库来为美国最绿色的公司进行评级。
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
随着互联网、大数据、人工智能等数字技术的发展和应用,推动社会经济以更细颗粒度的数据形式呈现,数据在软科学研究中发挥的作用也越来越大,为数据挖掘等提供了海量的样本数据,这使得建立基于数据驱动的研究范式成为可能,促使软科学研究范式由以往依靠专家驱动为主向数据驱动转变,更加强调运用数字
编者按“双碳”战略的实施加速了分布式能源在配电网中的接入,导致配电网运行特性发生深刻变化。同时,分布式能源的不确定性削弱了配电网的实时可观性,难以精准监测其运行状态,由此引发的过载、过压和供电质量下降等问题已严重威胁配电网的安全性和稳定性。传统配电网状态估计方法依赖全面、精确的量
贵州省黔北高原的层峦叠嶂间,白色风机如巨人般迎风矗立,将清洁电能输送至千家万户。在这幅壮美画卷中,总能看到新能源分公司黔北运维中心主任黄宜健穿梭于设备间的坚毅身影。今年4月,他带领团队成功完成太阳坪风电场02、07号风机主轴更换吊装任务,以精湛技艺、严谨作风和无私奉献,书写了新时代劳
2025年2月9日,国家发改委、能源局联合发布《关于深化新能源上网电价市场化改革促进新能源高质量发展的通知》,提出建立新能源可持续发展价格结算机制(简称“机制电价”),实行“多退少补”场外结算。(来源:微信公众号“鄂电价格”)对纳入机制电量范围的电量,如果市场均价低于机制电价,则对标机
近几年,以ChatGPT、DeepSeek等为代表的大模型取得显著进展,人工智能逐渐从感知向认知、从分析判断向生成式、从专用向通用转变,进入快速发展的新阶段。当人工智能发展进入热潮,我们或许也需要一些观察与思考,关于人工智能+电网,也关于电网转型发展。浪潮之下的起与落1897年爱迪生“点燃了”世界上
10月24日,由中国电子信息行业联合会举办的第二十六届中国国际软件博览会(以下简称“软博会”)在天津国家会展中心盛大开幕。本次软博会以“软件赋能产业变革,智能驱动数实结合”为主题,吸引了来自全国各地的260多家知名软件企业参展,展示了最新的科研成果和解决方案,并评选出“第二十六届软博会
能源是工业的粮食、国民经济的命脉。近年来,我国加快绿色低碳转型,新能源规模、技术和质量效益都实现了跨越发展。最新数据显示,2023年全球可再生能源新增装机5.1亿千瓦,其中中国的贡献超过了50%。实现新能源高质量发展,是建设美丽中国、提升经济社会发展水平的关键环节。与此同时,新能源的高速发
按照自治区国资委党委主题教育的统一安排部署,为深入学习贯彻新时代中国特色社会主义思想,进一步提升自治区国资国企系统党员干部党性修养、专业素养,以学促干推动国资国企高质量发展。8月7日上午,自治区国资国企系统党员干部党性锻炼素质能力提升培训班在内蒙古赤峰市敖汉干部学院开班,自治区国资
8月10日,全球首创的“通量-大气-遥感观测平台”揭牌仪式在上杭成功举行。该平台是为了解决目前通用涡度相关方法无法适用于复杂多变的山地地形而设计的关键科学难题。平台采用了“双塔移动碳通量观测平台”的创新设计,通过在两座山峰之间搭建观测塔,并利用钢索索道使观测设备能够跨越山谷进行观测,
“东数西算”工程,旨在推动数据中心合理布局、优化供需、绿色集约和互联互通,让西部的算力资源更充分地支撑东部数据的运算,更好的为国家数字化发展赋能。IT基础设施作为数据中心重要的一环,为人工智能、大数据、云计算等行业提供坚实的基础物理设施保证。符合新基建要求的IT基础设施解决方案将为“
编者按:今年是全面贯彻落实党的二十大精神的开局之年,开局关乎全局,起步决定全程。形势研判是开展所有研究的前提和基础,作为智库不仅要“看到”形势,关键是“洞察”形势。近期,国网能源研究院组织召开了开局形势研判专家专题会,围绕“一季度经济形势”和“开局能源电力形势”展开探讨研究。为此
近日,四川省经济和信息化厅公示了2025年第二批“企业找技术”揭榜挂帅项目定帅结果,环天智慧公司荣誉上榜。《高分辨率碳源监测卫星研发设计与反演算法》项目由环天智慧公司与南京航空航天大学航天学院开展深度合作,旨在研发具备高精度监测能力的碳源遥感卫星,通过创新性的光学载荷设计与智能反演算
6月26日,天津市人民政府办公厅关于印发《天津市碳排放权交易管理暂行办法》(以下简称《办法》)的通知。《办法》指出,重点排放单位可以通过本市碳排放权交易市场购买或者出售碳排放配额,其购买的碳排放配额可以用于清缴。重点排放单位足额清缴其碳排放配额后仍有结余的,可予以结转,具体规定由市
今年6月25日是全国低碳日,主题是“碳路先锋、绿动未来”。近年来,江苏积极践行绿色低碳理念,有效发挥城市、园区、企业等不同主体的主动性和创造性,探索行之有效的经验做法,形成了一批可操作可复制可推广的发展模式和典型经验。现推出江苏绿色低碳发展创新实践企业篇:南京钢铁股份有限公司南钢积
日前,南京市人民政府办公厅印发《南京市工业领域经认定的经营者(AEO)制度试点实施方案》(宁政办规字〔2025〕4号),以“免申即享”+“告知承诺”的方式,在工业领域试点推行经认定的经营者(AEO)分级行政检查制度。经认定,共726家工业企业获工业领域AEO制度首批试点企业资格。本次试点企业范围包
北极星碳管家网获悉,6月26日,工信部办公厅印发《关于深入推进工业和信息化绿色低碳标准化工作的实施方案》的通知。要点内容提炼如下:总体要求指导思想:以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大和相关全会精神,贯彻新发展理念,落实中央经济工作会议和全国新型工业化推进大
6月26日,工业和信息化部办公厅印发《关于深入推进工业和信息化绿色低碳标准化工作的实施方案》的通知,通知指出,产品碳足迹核算规则标准。按照急用先行原则,优先聚焦钢铁、电解铝、水泥、化肥、氢、石灰、玻璃、乙烯、合成氨、电石、甲醇、锂电池、新能源汽车、光伏和电子电器等重点产品,以及其他
6月26日,中共中央办公厅国务院办公厅发布《关于全面推进江河保护治理的意见》。其中指出,加快推进西南地区水电基地建设,合理布局、积极有序开发建设抽水蓄能电站,实施小水电站绿色改造提升,推进水风光一体化基地规划建设。全文如下:中共中央办公厅国务院办公厅关于全面推进江河保护治理的意见(2
近日,安徽亳州市发展和改革委员会、国网安徽省电力有限公司亳州供电公司发布关于印发2025年亳州电网迎峰度夏电力负荷管理方案的通知。2025年迎峰度夏期间,亳州电网预计最大负荷约340万千瓦,同比增长11.66%(2024迎峰度夏年最大304.5万千瓦)。亳州市大中型企业少,峰期居民负荷占比65%以上,可调控
6月26日,宁波前湾新区经济和信息化局印发《2025年宁波前湾新区迎峰度夏电力保供方案》。其中提到,根据省电力公司预测,今夏全省全社会最高负荷约1.33亿千瓦,最大用电缺口800万千瓦,新区约占1/100,即最大缺口8-10万千瓦。方案中明确移峰填谷方案安排:1.方案安排2025年新区移峰填谷方案共安排移峰
北极星储能网获悉,6月26日消息,宁波前湾新区经济和信息化局发布《2025年宁波前湾新区电力保供专项补贴实施方案》,《方案》提到,临时性区域调峰(虚拟电厂)补贴标准,在响应下达时段内有效响应,有市场出清补贴价格的在浙江省电力交易平台成交价格基础上新区财政另外补2元/千瓦时,区域自发邀约响
“有了这个‘智能柜’,大大提高了电能表出入库速度,‘先入先出’功能的应用,杜绝了高库领资产的堆积,这个柜体还自带预警系统,实时感知资产存储情况,避免在抢修时多拿错拿,提高了抢修的工作效率,真是既智能又方便啊!”6月25日,国网遵化市供电公司对供电所配备的“智能计量周转柜”进行培训,
北极星售电网获悉,6月25日,山东烟台市发展改革委发布第144322号:关于“高质量推进烟台实施绿色低碳转型”建议的答复。答复提出,能源结构优化方面。一是打造清洁能源示范高地,全国首个大规模近海桩基固定式海上光伏项目成功并网发电,实现山东海上光伏发电零突破,4大核电基地建设梯次推进,222万
位于呼和浩特市南20余公里的和林格尔新区,是国家“东数西算”工程八大枢纽、十大数据中心集群之一,也是国家大数据综合试验区的核心区。记者采访获悉,截至目前,新区46个数据中心项目总算力规模达9.1万P,其中智能算力规模达8.6万P。当地通过“风—光—储”一体化清洁能源供电方式为算力中心提供“绿
2025年6月23日,工业和信息化部等九部门关于印发《黄金产业高质量发展实施方案(2025—2027年)》的通知,通知指出,高端新材料应用:半导体用高纯低碳金(银)靶材和蒸发料、太阳能光伏银浆料、低温共烧陶瓷和片式多层陶瓷电容器等核心元器件用金浆料、生物医用金(银)材料、电接触金(银)及合金材
张海峰欢迎袁明一行的到访,并对华为公司长期以来给予内蒙古电力集团的关注和支持表示感谢。他表示,双方一直保持着良好的合作关系,希望进一步深化合作,创新合作模式,实现互利共赢;积极参与电力集团“十五五”电网规划编制,在技术、机制、产业等方面给予更多支持;在电力信息通信、大数据平台、构
近日,工业和信息化部等六部门联合印发《纺织工业数字化转型实施方案》(以下简称《实施方案》),聚焦新一代信息技术赋能行动、新模式新业态创新应用行动、产业高质量发展行动、夯实支撑基础行动等4个方面提出18项具体工作任务。《实施方案》提出,加速绿色化转型。推动纺织全产业链生产装备、用能单
北极星储能网获悉,6月23日消息,通辽市人民政府关于印发蒙东(通辽)绿色算力产业发展规划的通知,其中,打造绿色算力中心中提出,鼓励算力中心部署高效IDC设备,推广模块化UPS,支持算力企业探索利用共享储能、储氢、飞轮储能、锂电池等作为多元化储能和备用电源装置。优化算力中心能源、水资源、土
6月14日,随着金华燃机500千伏电力送出工程投运,今年浙江电网迎峰度夏重点工程全部投产。该工程起于金华燃机电厂,与500千伏双龙—兰溪电厂线路π接,并新建长12.36千米的500千伏金华燃机—双龙线路。该工程的投产可保障电厂发电可靠送出,增强金华地区电力供应能力。年初以来,浙江经济平稳向好,用
北极星输配电网整理了6月16日~6月20日的一周电网项目动态。浙江金华燃机500千伏送出工程6月14日,金华燃机500千伏送出工程投产。金华燃机500千伏电力送出工程总投资约1.4亿元,总长度12.36公里,新建38基铁塔,于2024年12月开工。项目起于金华燃机电厂,接入500千伏双兰、龙兰线。甘肃—浙江±800千伏
近日,经内蒙古电力集团内蒙古超高压供电公司全力推动、重点落实,内蒙古自治区电力能源重点项目——新区北500千伏输变电工程获自治区能源局核准批复。据了解,该工程建设地点位于呼和浩特经济技术开发区,总投资约4.91亿元,拟新建1座500千伏变电站,新建7.6公里线路。项目投产后,将有效缓解永圣域50
京能集团评标专家征集根据京能集团发展需要,现面向集团内部及社会开展评标专家公开征集工作,吸纳具备现场评标工作能力的专家入库,参加招标采购评标工作,有关要求和入库流程如下。一、基本要求评标专家人员需符合申报条件且自愿参加京能集团项目评标工作,能够自觉遵守招标投标法律法规及评标专家管
近年来,江苏省张家港市扬子江国际化工园创新建立了打通生产工艺链、污染控制链和监测监管链的系统化环境治理模式,为化工园区绿色低碳发展提供了有益探索。智能改造、低碳转型,升级绿色产业链扬子江化工园(以下简称园区)是长江流域最大的精细化工园区,建有国内最大的高性能涂料生产基地,生产过程
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!