从 2012 年到 2015 年,大数据持续发威,IDC 市场调查机构预测 2017 年大数据市场将价值 324 亿,拥有这样“Big Data、Big Deal”远见的人,正在利用大数据激荡出最有创意的构想,用数据的力量来创造出大量的价值。从让资料搜寻分析平台,到利用大数据帮助癌症治疗,大数据新创公司这几年内如雨后春笋般出现,2015 年这些“Big Data Startups”也会持续挖掘大数据的价值、微调其企业策略,期盼在市场中展露头角。以下几家新创公司都已经各自获得好几轮金额可观的融资,在大数据市场中十分有潜力,值得我们关注并参考,从中瞭解大数据的应用方向及潜能。
SumAll
SumAll 是一家位于纽约的新创公司,成立于 2011 年,主要为中小型企业提供即时数据分析服务。SumAll 的线上分析平台收集社交媒体及电子商务上的数据,并进行分析后,把可视化的分析结果展示在互动介面上供企业客户参考。例如社交页面上的网页流量、ebay 上的销售量等数据,生成每星期、每个月的分析报导,让企业客户追踪且分析使用者/消费者。
这家公司还有一个很酷的地方:他们分了百分之十的股份给旗下的 SumAll.org —— 一家旨在用资料分析增加社会福利的非盈利组织。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大学媒体实验室的一个研究项目,后来发展成利用人工智慧进行文本分析的新创公司。从通讯工具里的讯息、网络上的评论等数据来源,利用自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题。
举例来说,Luminoso 提供的服务可以帮助企业追踪时下发生的热门讨论,还可以根据需求迅速回应,如果消费者对于某产品的缺陷在网上进行了投诉或者抱怨,企业可以及时进行补救。
Flatiron Health
同样发源于纽约的 Flatiron Health 成立于 2012 年,是大数据应用界中是十分有名的“医疗大数据技术”新创公司,主要专注于癌症数据分析1。
Flatiron Health 透过各种管道收集病患的临床纪录、医师诊断纪录、患者治疗结果、基因数据及缴费纪录等数据,透过分析整合后提交给肿瘤学家,透过分析过往的治疗方法跟纪录,帮助医生做出更好的临床诊断跟医治手段。全美现在有约 1000 名肿瘤学家在使用 Flatiron Health 的数据。
Flatiron 的分析平台 OncologyClound 百分之百致力于分析肿瘤学数据,不过 Flatiron 公司也表示,现在全美只有 4% 的癌症病人参与临床试验,另外 96% 无法取得的癌症病人数据则成为大数据分析中的缺口。
Domo
Domo 成立于 2010 年,总部位于犹他州盐湖城,是一家为企业决策层提供商业智慧(BI)的初创公司。2014 年就累积了约有 500 多家签约客户,其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商业智慧云端平台可以即时分析多方资料,将多方来源提供的结构化及非结构化数据以即时、视觉化的方式呈现出来,不但帮助企业做决策,也是一个业务管理平台。
Tamr
Tamr 成立于 2013 年,其技术来自于麻省理工的电脑与人工智慧实验室,由麻省理工学院教授兼数据专家 Michael Stonebraker 跟种子投资家 Andy Palmer 共同创办,在 2014 年正式营运。
大数据的其中一个问题就是资料量太大了,而且资料来源剧增又不断变换,Tamr 的机器学习演算法跟软件能有效而大规模地广泛整合和管理现有和未来的多种数据来源,大量降低数据来源的搜集与连结所用的时间,同时辨别资料来源及之间的关联。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,总部位于旧金山,算是十分有名的大数据分析挖掘软件新创公司,该公司总裁兼首席执行长 Joe Otto 和首席产品长 Steven Hillion 都来自于被云端储存服务提供商 EMC 收购的 Greenplum 公司。
大部份的大数据新创公司都在做“资料可视化(Data Visualization)”,Alpine 则是提供大数据及 Hadoop 的预测性分析功能,且号称是全球第一个针对大数据的团队合作分析解决方案。
DataStax
DataStax 成立于 2010 年,总部位于加州,在去年 9 月曾获得惊人的 1 亿 600 万美元 E 轮融资。
DataStax 主要业务是开发和销售开源分布式数据库 Apache Cassandra 的商业化版本。Apache Cassandra 是高扩展性、高容错的 NoSQL 数据库,比传统的关系式数据库多了许多优势,其设计不仅兼顾了扩展性和开发灵活性,而且搜寻效率也相当不错,特别适合大数据的储存,像是 Cisco、eBay 等大公司都在使用这种数据库。
Altiscale
Hadoop 在这几年内被公认成为大数据的主流技术,而 Hadoop 也是 Altiscale 这家新创公司能够迅速成长茁壮的原因。
Altiscale 成立于 2012 年,总部在加州 Palo Alto,其 CEO 兼创办人是曾在 Yahoo 任职首席技术长(Chief Technology Officer)的 Raymie Stata ,其高层还有同样来自 Yahoo 曾担任首席架构师(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的发源地,那这家由 Yahoo 前任高管们所创立的大数据公司主打“Hadoop-as-a-Service”也就一点都不奇怪了。
Altiscale 的服务是解决 Hadoop 的抽象性与复杂度,为工程师搭建一个完整的 Hadoop 环境,并且对其进行维护与管理,让使用者可以更专注于数据和应用。
WibiData
WibiData 位于旧金山的创业公司,成立于 2010 年,联合创始人 Christophe Bisciglia 为企业数据管理分析公司Cloudera 的联合创始人之一,WibiData 的另一名联合创始人 Aaron Kimball 则是 Cloudera 聘用的第一个工程师2。
这家公司所开发的 WibiEnterprise 平台是由一系列的开源Apache 技术建构而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即时收集、分析、服务数据的 Kiji 开源框架,其平台的功能是为消费者即时打造客制化的推荐内容及相关搜寻结果,和电子商务龙头 Amazon 所做的类似。