登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
大数据时代的数据收集与分析
在数据收集和分析这一正在繁荣发展的行业中,吉拉德-艾尔贝兹可能是最具影响力的投资者,他试图找出世界上的每一个事实,并将这些事实都容纳在被他称为Factual的公司中。自2008年创办以来,Factual已经吸收了大量的事实,其计划是为相互之间联系紧密的数千个超计算云建立全球范围内最主要的参照点。以下是这篇文章的全文。
在数据收集和分析这一正在繁荣发展的行业中,Factual创始人、此外还对其他30多家创业公司进行投资的吉拉德-艾尔贝兹(Gilad Elbaz)可能是最具影响力的投资者。
在7岁大时,艾尔贝兹曾写道:“我希望成为一名富裕的、非常聪明的数学家。”原因是,那将帮助他“发明时间机器、机器人(16.990,-0.56,-3.19%)和能回答任何问题的机器之类的东西”。
此后的34年时间里,艾尔贝兹已经完成了许多的目标,他已创造了能穿越网络的软件机器人、为谷歌(微博)回答了一些非常重大的问题,并在这一过程中获得了远远超过百万富翁的财富。
但是,他的时间机器计划则已被抛弃,原因是其发现了更加重要的事情,那就是试图找出世界上的每一个事实,并将这些事实都容纳在被他称为Factual的公司中。
“世界是一个大数据的问题。”艾尔贝兹在这家公司的总部中说道,这是一间安静的办公室,比洛杉矶乡村俱乐部高14层楼。他身形纤瘦,说话温和,当有什么想法让他感到激动时,他会在椅子中不停地摇动身体。“如果能在一写下错误的东西时就能马上发现,那将会怎样的一种情况?Factual肯定会是改变商界的新事物,对计算来说也是一种宝贵的新工具。”
在“大数据”蓬勃发展的这个年代里,曾经是难以想象的数量庞大的信息正在汇聚起来,从而创造出足以改变世界的发明。而在这一领域中,艾尔贝兹可能是最具影响力的发明者和投资者。除了Factual以外,他还对30家创业公司进行了投资,其中包括旧金山的一个致力于“大数据”的企业孵化器。Factual的总部位于星光大道的一幢高楼中,艾尔贝兹在这里主持召开研讨会,希望在洛杉矶地区培育一个数据社区。
艾尔贝兹还是其母校加州理工学院理事会的一员,同时还是X Prize Foundation基金的成员,这个基金会向在太空飞行、医药和基因科学等领域克服难题的团队提供现金奖金。艾尔贝兹出售给谷歌的公司Applied Semantics是谷歌旗下AdSense业务的基础,这项业务每年都能给谷歌带来接近100亿美元的营收。
虽然艾尔贝兹的投资额十分庞大,而且对前景的展望也很有价值,但他仍相对鲜为人知。他是如此的不爱出风头,以至于当最近他在参加一次有3000名数据科学家参加的会议时,仅有他投资的一家公司的几名职员认识他。他与曾经是联邦检察官的妻子和三名子女住在西好莱坞的一座乡间别墅中,一家人过着安静的生活。在个人兴趣方面,他喜欢在当地的一家运动俱乐部中打篮球。
艾尔贝兹说道,他的精神和金融资产就像是他需要分配的礼物,从而让世界变得更加美好。
“如果所有的数据都明晰无误,那么从世界扣掉价值的人就会减少很多,”他说道,“而为世界增添价值的人就会增加很多。”
创造明确的、可靠的数据还能让Factual成为一家规模很大的公司。
“艾尔贝兹远远领先于我们其他人,对于这位企业家所说的每件事情,我都要过几分钟才能理解。”通过麾下公司Andreessen Horowitz为Factual提供支持的风险资本家本-霍洛维茨(Ben Horowitz)说道。“在三年以前,他认为Factual是改变世界的最大机会。而随着时间的推移,世界已经朝着他所预料的方向发生了变化。”
自2008年创办以来,Factual已经吸收了大量的事实,用艾尔贝兹的话来说,就是“我们已经收集了数百上千亿的个体事实”。
Factual不仅向大公司提供数据,同时也面向规模较小的软件开发商,这些数据中包括可用的政府数据、以兆兆字节为计量单位的公司数据、以及全球50个国家的6000多个地方的信息,每一条信息都有17到40条的相关描述。Factual用30种不同的方式对80多万个餐馆加以描述,其中包括地址、所有权以及食客和卫生组织的评价等。此外,这些数据还包括5亿个网页的信息、一份美国高中列表以及美国180万名医疗保健专家的办公室所在地、特长和保险偏好等,还包括1.4万种葡萄酒的列表、从1950年到1974年的军用飞机事故、以及大型庆典活动的参加人数等。艾尔贝兹指出,即使是奇特的事实也会有用处。
在靠近Factual总部的地方,艾尔贝兹储存着500兆兆字节的数据,这大致相当于整个国会图书馆所需数据量的两倍。在亚马逊(微博)庞大的计算机云内部,他还存储着更多的数据。他领导下的统计员们对大量的数据进行了收集和清理,用来说明很多事情,比如说卫生部门在对卫生设施进行评分时的差异性、“中学”这个词汇在某个特别的镇上意味着两年还是三年的时间、以及原始数据及其副本之间是否存在修正等。
Factual的计划是,为相互之间联系紧密的数千个超计算云建立全球范围内最主要的参照点。到今年底为止,数字世界的数据总量预计将会达到2.7泽字节(一泽字节相当于一万亿GB),大约相当于7000亿张DVD的数据容量。Factual目前的员工总数为50人,当世界开始增长,以及这些数据库开始互的情况下,这家公司的价值将被证明是极其庞大的。
Factual按浮动价格向公司和独立软件开发商出售数据,其依据是有多少信息被使用。小规模的数据提供是免费的,而最大型客户需要支付的费用则会达到成百上千万美元。在有些时候,Factual还会与其他公司进行数据交易,目的是扩大自身所占有的资源。
就目前而言,某些客户使用Factual的数据是为了向手机地图加入餐厅地址等信息,或者是为了规划销售战略等。但Factual的真实目的则要更加广泛,直指当前时代一项重大业务的核心,那就是利用所有基于云的数据和算法,来找到自然和社会的模式,供科学家加以观察,同时供商界加以开拓。
“数据一直都仅被视为计算的副作用,一种当你工作时用来查阅的东西。”艾尔贝兹说道。“而我们将其视为一个完全独立的层面,是每个人在希望解决问题时都不得不去挖掘数据的层面,但你自己可能没有所需的完全可靠的数据。”
举例来说,一个餐饮连锁运营商可利用Factual来找出一个新的选址是否靠近竞争对手,以及当地人在社交点评网站Yelp上如何谈论这个地方。查阅餐厅附近的加油站数据可以知道有多少辆汽车会从高速公路上开下来,运营商还可利用Factual来看看自己的餐厅在网络上的哪些地方被提及,或是纠正其他人所说的有关餐厅的情况。
Factual拥有来自于多名硅谷明星级人物的2700万美元融资,目前仍是一家封闭式持股的公司,但却已经有了成千上万的客户。Facebook、CitySearch、AT&T及其他一些公司都会使用Factual来获得有关某些地方的信息,《新闻周刊》则使用数据库来为美国最绿色的公司进行评级。
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
2025年的4月28日,西班牙电网在短短的5秒之内失去了超过15吉瓦的电力。这场持续十几个小时的大停电,让5000万人的生活停摆,居民通讯中断、医疗系统停滞、公共交通瘫痪。突如其来的大停电也引发了我们对当今能源转型的思考#x2014;#x2014;极端天气频发、新能源大量接入、设备老化等一系列情况下,电网如
随着互联网、大数据、人工智能等数字技术的发展和应用,推动社会经济以更细颗粒度的数据形式呈现,数据在软科学研究中发挥的作用也越来越大,为数据挖掘等提供了海量的样本数据,这使得建立基于数据驱动的研究范式成为可能,促使软科学研究范式由以往依靠专家驱动为主向数据驱动转变,更加强调运用数字
编者按“双碳”战略的实施加速了分布式能源在配电网中的接入,导致配电网运行特性发生深刻变化。同时,分布式能源的不确定性削弱了配电网的实时可观性,难以精准监测其运行状态,由此引发的过载、过压和供电质量下降等问题已严重威胁配电网的安全性和稳定性。传统配电网状态估计方法依赖全面、精确的量
贵州省黔北高原的层峦叠嶂间,白色风机如巨人般迎风矗立,将清洁电能输送至千家万户。在这幅壮美画卷中,总能看到新能源分公司黔北运维中心主任黄宜健穿梭于设备间的坚毅身影。今年4月,他带领团队成功完成太阳坪风电场02、07号风机主轴更换吊装任务,以精湛技艺、严谨作风和无私奉献,书写了新时代劳
2025年2月9日,国家发改委、能源局联合发布《关于深化新能源上网电价市场化改革促进新能源高质量发展的通知》,提出建立新能源可持续发展价格结算机制(简称“机制电价”),实行“多退少补”场外结算。(来源:微信公众号“鄂电价格”)对纳入机制电量范围的电量,如果市场均价低于机制电价,则对标机
近几年,以ChatGPT、DeepSeek等为代表的大模型取得显著进展,人工智能逐渐从感知向认知、从分析判断向生成式、从专用向通用转变,进入快速发展的新阶段。当人工智能发展进入热潮,我们或许也需要一些观察与思考,关于人工智能+电网,也关于电网转型发展。浪潮之下的起与落1897年爱迪生“点燃了”世界上
10月24日,由中国电子信息行业联合会举办的第二十六届中国国际软件博览会(以下简称“软博会”)在天津国家会展中心盛大开幕。本次软博会以“软件赋能产业变革,智能驱动数实结合”为主题,吸引了来自全国各地的260多家知名软件企业参展,展示了最新的科研成果和解决方案,并评选出“第二十六届软博会
能源是工业的粮食、国民经济的命脉。近年来,我国加快绿色低碳转型,新能源规模、技术和质量效益都实现了跨越发展。最新数据显示,2023年全球可再生能源新增装机5.1亿千瓦,其中中国的贡献超过了50%。实现新能源高质量发展,是建设美丽中国、提升经济社会发展水平的关键环节。与此同时,新能源的高速发
按照自治区国资委党委主题教育的统一安排部署,为深入学习贯彻新时代中国特色社会主义思想,进一步提升自治区国资国企系统党员干部党性修养、专业素养,以学促干推动国资国企高质量发展。8月7日上午,自治区国资国企系统党员干部党性锻炼素质能力提升培训班在内蒙古赤峰市敖汉干部学院开班,自治区国资
8月10日,全球首创的“通量-大气-遥感观测平台”揭牌仪式在上杭成功举行。该平台是为了解决目前通用涡度相关方法无法适用于复杂多变的山地地形而设计的关键科学难题。平台采用了“双塔移动碳通量观测平台”的创新设计,通过在两座山峰之间搭建观测塔,并利用钢索索道使观测设备能够跨越山谷进行观测,
“东数西算”工程,旨在推动数据中心合理布局、优化供需、绿色集约和互联互通,让西部的算力资源更充分地支撑东部数据的运算,更好的为国家数字化发展赋能。IT基础设施作为数据中心重要的一环,为人工智能、大数据、云计算等行业提供坚实的基础物理设施保证。符合新基建要求的IT基础设施解决方案将为“
北极星售电网获悉,近日,国家能源局发布国对十四届全国人大三次会议第6253号建议的答复。关于分布式光伏参与电力市场交易,答复文件明确,针对分布式新能源参与市场存在的困难,国家能源局印发的《关于支持电力领域新型经营主体创新发展的指导意见》(国能发法改〔2024〕93号)明确提出分布式电源可直
7月21日,河北省发改委发布关于公开征求《河北省分布式光伏发电开发建设管理实施细则》意见的公告。文件提到,用固定建筑物屋顶及其附属场所建设的容量、电压等级超出第五条规定的光伏发电项目,按集中式光伏电站管理,自由选择三类上网模式;选择自发自用余电上网模式的,自发自用比例不得低于50%。上
北极星售电网获悉,7月21日,河北省发展和改革委员会发布关于公开征求《河北省分布式光伏发电开发建设管理实施细则》意见的公告。文件明确,分布式光伏发电上网模式包括全额上网、全部自发自用、自发自用余电上网三种。其中,全额上网和自发自用余电上网项目,按照河北省有关规定参与市场化交易。涉及
北极星氢能网获悉,在7月18日举行的国新办新闻发布会上,工业和信息化部新闻发言人、运行监测协调局局长陶青表示,深挖传统产业绿色低碳发展潜力,推动传统产业“扩绿增效”。她表示,落实《制造业绿色低碳发展行动方案(2025—2027年)》要求,未来要将传统产业深度绿色转型作为首要任务,聚焦钢铁、
日前,九江人大发布关于公开征求《九江市固体废物污染环境防治条例(草案二次审议稿草稿)》意见的公告。详情如下:关于公开征求《九江市固体废物污染环境防治条例(草案二次审议稿草稿)》意见的公告《九江市固体废物污染环境防治条例(草案)》将于2025年7月底提请市人大常委会进行第二次审议。为进
7月17日,贵州省发改委、经信厅、能源局联合下发《关于组织申报国家级零碳园区的通知(发改环资〔2025〕910号)》。通知要求:根据《国家发展改革委工业和信息化部国家能源局关于开展零碳园区建设的通知》要求,将开展首批国家级零碳园区建设遴选工作。请你们对照要求,认真组织符合要求的园区申报,每
7月18日,国务院新闻办公室举行新闻发布会,介绍2025年上半年工业和信息化发展情况。工业和信息化部总工程师谢少锋,部新闻发言人、运行监测协调局局长陶青,部信息通信发展司司长谢存出席发布会,介绍相关情况并回答记者提问。上半年工业和信息化事业发展态势良好新型工业化加快推进工业和信息化部总
广东灵活调节能力现状及提升路径分析——《新型电力系统下广东灵活调节能力分析及提升举措》摘编王雪辰/整理(中能传媒能源安全新战略研究院)在构建新型电力系统进程中,电力系统的运行特性发生了根本性的变化。新能源大规模接入电网,导致电力系统的灵活调节需求急剧攀升,传统电力系统的灵活调节能
7月18日,国新办举行新闻发布会,介绍2025年上半年工业和信息化发展情况。工业和信息化部新闻发言人、运行监测协调局局长陶青在回答记者提问时表示,下一步,我们将重点抓好两大行动,推动装备制造业高质量发展:一是实施新一轮稳增长行动。近期将印发机械、汽车、电力装备等行业稳增长工作方案,提升
国新办18日举行新闻发布会,工信部总工程师谢少锋在会上介绍了2025年上半年工业和信息化发展情况。他透露,主要经济指标总量和增速稳步提升,上半年规上工业增加值同比增长6.4%。谢少锋表示,今年上半年,面对更加严峻复杂的外部环境,工业和信息化系统认真贯彻落实党中央、国务院决策部署,坚持稳中求
7月17日,贵州省发展改革委省工业和信息化厅省能源局关于组织申报国家级零碳园区的通知(发改环资〔2025〕910号)。通知指出,根据《国家发展改革委工业和信息化部国家能源局关于开展零碳园区建设的通知》要求,将开展首批国家级零碳园区建设遴选工作。请你们对照要求,认真组织符合要求的园区申报,每
7月18日,国务院新闻办公室举行新闻发布会,介绍2025年上半年工业和信息化发展情况。工业和信息化部总工程师谢少锋,部新闻发言人、运行监测协调局局长陶青,部信息通信发展司司长谢存出席发布会,介绍相关情况并回答记者提问。上半年工业和信息化事业发展态势良好新型工业化加快推进工业和信息化部总
500多家展商800个展位30,000平米展出面积35,000名专业观众一、展会概况深入贯彻落实习近平总书记关于水旱灾害防御和水利基础设施建设的重要指示批示精神,着力推动解决农业小型水利设施老化、塘坝淤塞严重、水渠不畅等问题,提高农业抵御与自然灾害和综合生产能力,全面推进乡村振兴、加快农业水利强省
走进山东能源兖矿智慧制造园区,一栋栋标准化厂房拔地而起,道路两旁的微风发电智慧路灯随风转动,抬眼望去,阳光穿透薄云,洒在成片的深蓝色光伏阵列板上,整个光伏矩阵泛起粼粼波光,从对山林时序的尊重敬畏,升华为对自然节律的精准驾驭。作为山东省重点项目,兖矿智慧制造园区正以绿色低碳发展为引
北极星储能网在天眼查获悉,7月15日,国峰(深圳)软件开发有限公司成立,注册资本5,000万人民币,法定代表人为刘锐。经营范围包含新兴能源技术研发;储能技术服务;软件开发;软件销售;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;发电技术服务;电力行业高效节能技术研发;技术进
在河北省怀来县,一座大数据产业基地已然成型。科技感十足的园区内,密集部署的服务器为京津冀的互联网、金融、医疗等企业提供了安全高效的数据存储与计算能力保障。“园区供电设备已验收合格,具备送电条件,服务器随时可以启动。”5月23日,在位于怀来县的阿里云计算数据中心110千伏用户变电站内,张
新能源主导地位凸显——中电联电力行业年度发展报告解读7月10日,中国电力企业联合会(以下简称“中电联”)发布《中国电力行业年度发展报告2025》(以下简称《报告》)。《报告》显示,在2024年电力行业发展中,新能源主导地位持续凸显,绿色低碳转型加速推进。新能源参与市场化交易电量突破万亿千瓦
7月10日,中国电力企业联合会举办新闻发布会,发布《中国电力行业年度发展报告2025》(简称“报告”)。《报告》显示,截至2024年底,全国全口径发电装机容量33.5亿千瓦,同比增长14.6%。其中,并网风电5.2亿千瓦,同比增长18.0%(其中陆上风电4.8亿千瓦,海上风电4127万千瓦);并网太阳能发电8.9亿千瓦,
北极星储能网获悉,近日,中国科学院深圳先进技术研究院发布了关于“储能BMS参数估算算法委托开发公示”的通知。据通知显示,中国科学院深圳先进技术研究院已向南京苏宸人工智能科技有限公司采购储能BMS参数估算算法研究服务,合同总价格为25.5万元人民币。现将服务合同、三方报价单内容予以公示,公示
北极星风力发电网获悉:近日,上纬新材料科技股份有限公司发布公告称,智元机器人掌舵者邓泰华通过旗下持股平台,以每股7.78元的价格协议受让公司29.99%股份及对应表决权,同步启动要约收购计划拟增持1.49亿股。若交易完成,邓泰华将合计控制上纬新材66.99%股权,耗资累计达21亿元。受此消息刺激,上纬
7月10日,中国电力企业联合会举办新闻发布会,中电联秘书长、新闻发言人郝英杰发布《中国电力行业年度发展报告2025》(以下简称“《报告》”)。这是中电联连续20年发布年度发展报告。作为中电联“1#x2B;N”年度系列报告的主报告,《报告》以电力行业统计与调查数据为依据,系统回顾了我国电力行业2024
#x200C;2025年7月9日,昆山市花桥镇#x2014;#x2014;云神和新能源科技(苏州)有限公司今日在此地隆重举行光伏智能清扫机器人昆山工厂的投产仪式,标志着云神和向全球光伏智能制造领域迈出了一个崭新的时代。随着新一代“CA-05”光伏清扫机器人的成功下线,云神和新能源正式拉开了其由“制造”向“智造”
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!