大数据和云有什么区别?


回答 1:

这是可以一起使用的两个单独的主题。 两者的定义都有一定的模糊性,因此也会导致一些不确定性。 因此,让我尝试定义它们(基本上,我确定其他人会看到这些定义略有不同)

云计算:可以轻松地重新分配给任何数量的工作负载的基础架构。 这些计算资源捆绑在一起成为一个计算云。 用户可以配置和分配计算云的一部分以执行其任务,而其他用户的工作负载也位于云中。 由于基础资源是不可区分的,因此可以针对任何工作负载快速增加或减少计算资源。

与传统的计算模型相比,这带来了许多优势。

  • 新的工作负载可以非常快速地分散-没有购买周期,没有硬件设置,只需部署和运行计算性能可以快速变化-可以上下更改计算资源以满足当前的需求,从而节省了成本更高的标准化-由于云计算资源是一组有限的配置,所有应用程序都需要在这些配置上运行,从而驱动应用程序之间的软件重用基础架构作为代码-由于大多数云配置都可以通过代码来建立或更改,因此计算环境变得易于复制,从而具有更大的扩展,重新定位,或恢复计算解决方案

还有一些不利因素:

  • 某种程度上,云计算机是共享的-提供商需要确保用户之间的隔离度很高。当云计算机处于空闲状态时,仍然有人需要为它们“付费”-通常,空闲时间包含在使用云的费用中(因为平均专用数据中心计算机的利用率仅为30%,大多数大型云提供商的利用率均超过90%,这的确没有太大的不利影响)

云计算模型也多种多样:

  • 公有云-提供云计算资源的第三方公司(例如AWS)私有云-通常,大型公司的中央IT部门将建立云以更好地利用计算资源混合云-公有云和私有云资源的组合实现两者的好处

大数据:如果信息/数据内容的大小非常大并且来自许多不同的来源,则通常将其描述为大数据。 但是,在许多情况下,仅基于大小将数据解决方案称为大数据。 无论哪种方式,通常由实施者决定是否将其解决方案描述为大数据。

实际定义通常与所使用的工具和过程有关,而与数据描述无关。 当公司从处理其历史数据工作负载过渡到扩展以引入新工具(Hadoop,数据仓库,流分析等)时,这种过渡通常称为“迁移到大数据”。 因此,各个公司的定义差异很大。 与过去相比更多的数据,再加上以前从未使用过的新工具,等于组织过渡事件,这种事件通常被称为大数据过渡。 很软

公共云中的大数据:正如您可能已经发现的,这些看似无关的主题通常是齐头并进的。 这是由于它们的云所带来的经济变化以及快速廉价地试用已在公共云中配置的新工具的能力。 当组织要求管理层将公司内所有各种数据源整合在一起并“释放”其中的价值时,我是否要在新的硬件和软件上花费数百万美元,以查看存在的价值,还是我要走?使用公共云中可用的按需付费模式? 这些公共云公司提供了现成的产品,使我可以使用所有各种工具,并且可以在一天内开始研究解决方案。 要在传统模型中进行设置,需要我研究工具,选择一套,定义要运行的硬件,提交资本购买请求,等待四分之一,订购设备,安装和配置它,然后开始学习如何“解锁”数据中的值。 大多数人都选择公共云。

因此,这两个概念是完全分开的,但通常会同时出现。 这样,我完全可以看出每个概念是什么以及它们之间有何不同。

我希望这有帮助


回答 2:

云只是指在其他地方托管的远程服务器中某些事物的生存或发生的位置。

尽管大数据分析和实现确实在云中进行,但并不限于云。 许多公司都有内部庞大的内部存储库,他们倾向于本地存储。

您会看到很多术语,因为许多公司出于多种原因(速度,成本,资产保护,效率)正朝着基于云的系统迈进,但是这些公司所做的事情都可以在内部服务器上完成,只要它们足够大型且已配置。


回答 3:

他们是两个不同的东西。

大数据通常是指存储和处理大量数据。

云(计算)是指一组功能,这些功能提供通常可以通过API在Internet上提供的基础结构(服务器和存储)以及服务(例如,机器学习,部署等)。

大数据往往需要大量的基础设施,而这正是两个世界相交的地方。 云计算使启动可用于大数据目的的服务器(也可将它们也下降)变得更加容易。

除了基础架构之外,云提供商还提供托管服务,在这些服务中,他们为大数据提供和维护基础架构,因此客户可以只关注用例。 例如:Amazon EMR。