01 移动计算比移动数据更划算

Primarbird

2024-04-25 帮助1人

大数据和传统的软件开发技术在架构思路上有很大不同，大数据技术更关注数据。因此相关的技术都是围绕数据的，要考虑如下三个核心要素：

传统的软件计算处理模型是是“输入 -> 计算 -> 输出”模型，大数据要采取分布式架构的思路。

关于分布式架构，可以参考《大型网站技术架构：核心原理与案例分析》，采用分布式集群的解决方案，利用数千或者数万台计算机构建一个大数据集群。

围绕这样的思路，大数据系统可以简单的总结成如下四个维度：

【目的】大数据的计算处理通常针对的是网站的存量数据，网站大数据系统要做的就是将这些统计规律和关联计算出来，并由此改善用户的体验和运营策略。

【核心思路】数据量既然是庞大的，而程序比数据要小的多，将数据输入给程序就不如将程序分发到数据所在的地方进行计算，也就是移动计算比移动数据划算。

【具体实现】要向多台计算机合作构成一个系统，必须要在技术上实现架构，这就是广泛使用的负载均衡、分布式缓存、分布式数据库、分布式服务等种种分布式系统。具体实现如下：

【原则】尽量使用无状态的服务，不同服务实例之间不共享状态，也就是不持有数据，用户请求交给任何一个服务实例计算，处理的结果都是一样的。

移动程序到数据所在的地方去执行，就类似于杀毒软件从服务器更新病毒库，然后再windows上内查杀，也是一种移动计算，比移动数据更划算的例子

大数据移动计算这一个编程技巧上升到编程模型的高度，并发了相应的框架，让开发只需要关注大数据的算法实现，而不必关心如何将这个算法在分布式环境中执行，极大简化了大数据开发难度。

这篇好文章是转载于：学新通技术网

photoshop保存的图片太大微信发不了怎么办