英语四级六级培训课程

翻译词语:“云数据”有关术语50例

时间:2022-3-30 作者:爱思英语网

翻译词语:“云数据”有关术语50例(上)

【编者按】当每人感叹自己所处的俨然是一个“云数据”的年代的时候,“云数据”的内涵和外延你都知道了吗,这类“内涵”热词,你值得拥有~~~~

1、云数据

英文:big data,mega data

云数据,或称巨量资料,指的是需要新处置模式才能具备更强的决策力、洞察发现力和步骤优化能力的大量、高增长率和多样化的信息资产。

2、云数据的4V:

Volume(很多)、Velocity(高速)、Variety(多样)、Value(价值)

3、目前用于剖析云数据的工具主要有开源与商用两个生态圈

开源云数据生态圈:

1、Hadoop HDFS、HadoopMapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。

2、. Hypertable是另类。它存在于Hadoop生态圈以外,但也过去有一些用户。

3、NoSQL,membase、MongoDb

商用云数据生态圈:

1、一体机数据库/数据仓库:IBM PureData(Netezza), OracleExadata, SAP Hana等等。

2、数据仓库:TeradataAsterData, EMC GreenPlum, HPVertica 等等。

3、数据集市:QlikView、 Tableau 、 与国内的Yonghong Data Mart 。

4、Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础构造。

用户可以在不知道分布式底层细节的状况下,开发分布式程序。充分借助集群的威力进行高速运算和存储。

Hadoop达成了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特征,并且设计用来部署在低廉的(low-cosplayt)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,合适那些有着超云数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的需要,可以以流的形式访问(streaming access)文件系统中的数据。

Hadoop的框架最重要的设计就是:HDFS和MapReduce。HDFS为大量的数据提供了存储,则MapReduce为大量的数据提供了计算。

5、Apache基金会

Apache软件基金会(也就是Apache Software Foundation,简称为ASF),是专门为支持开源软件项目而办的一个非盈利性组织。在它所支持的Apache项目与子项目中,所发行的软件商品都遵循Apache许可证(Apache License)。

6、MapReduce

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。定义”Map(映射)”和”Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特质。它很大地便捷了编程职员在不会分布式并行编程的状况下,将我们的程序运行在分布式系统上。 目前的软件达成是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每个共享相同的键组。

7、BI

商业智能(BI,Business Intelligence)。

BI(Business Intelligence)即商务智能,它是一套完整的解决方法,用来将企业中现有些数据进行有效的整理,迅速准确的提供报表并提出决策依据,帮企业做出明智的业务经营决策。

8、CRM

CRM即CRM,是指企业用CRM技术来管理与顾客之间的关系。在不同场所下,CRM可能是一个管理学术语,可能是一个软件系统。一般所指的CRM,指用计算机智能化剖析销售、市场推广、顾客服务与应用等步骤的软件系统。它的目的是通过提升顾客的价值、认可度、盈利性和忠实度来缩减销售周期和CPS、增加收入、探寻扩展业务所需的新的市场和途径。CRM是选择和管理有价值顾客及其关系的一种商业方案,CRM需要以顾客为中心的企业文化来支持有效的市场推广、销售与服务步骤。

9、云计算

云计算(cloud computing)是基于网络的有关服务的增加、用和出货模式,一般涉及通过网络来提供动态易扩展且常常是虚拟化的资源。云是互联网、网络的一种比喻说法。过去在图中总是用云来表示电信网,后来也用来表示网络和底层基础设施的抽象。因此,云计算甚至可以叫你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展势头。用户通过电脑、笔记本、手机等方法接入数据中心,按个人的需要进行运算。

10、云计算有关

分布式计算(Distributed Computing)

并行计算(Parallel Computing)

功用计算(Utility Computing)

互联网存储(Network Storage Technologies)

虚拟化(Virtualization)

负载均衡(Load Balance)

热备份冗余(High Available)

十1、数据仓库

数据仓库,英文名字为Data Warehouse,可简写为DW或DWH。数据仓库是为企业所有级别的决策拟定过程提供支持的所有种类数据的策略集合。它是单个数据存储,出于剖析性报告和决策支持的目的而创建。 为企业提供需要业务智能来指导业务步骤改进和监视时间、本钱、水平和控制。

十2、非关系型数据库

NoSQL,泛指非关系型的数据库。伴随网络web2.0网站的兴起,传统的关系数据库在应对web2.0网站,尤其是超大规模和高并发的SNS种类的web2.0纯动态网站已经看上去力不从心,暴露了不少难以克服的问题,而非关系型的数据库则因为其本身的特征得到了很飞速的进步。NoSQL数据库的产生就是为知道决大规模数据集合多重数据类型带来的挑战,特别是云数据应用难点。

十3、结构化数据

结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达达成的数据)而言,不便捷用数据库二维逻辑表来表现的数据即称为非结构化数据,包含所有格式的办公文档、文本、图片、标准通用标记语言下的子集XML、HTML、各类报表、图像和音频/视频信息等等。

十4、结构化剖析办法

结构化剖析办法(Structured Method,结构化办法)是强调开发办法的结构合理性与所开发软件的结构合理性的软件开发办法。结构是指系统内各个组成要点之间的相互联系、相互用途的框架。结构化开发办法提出了一组提升软件结构合理性的准则,如分解与抽象、模块独立性、信息隐蔽等。针对软件存活周期各个不一样的阶段,它有结构化剖析(SA)和结构化程序设计(SP)等办法。

十5、半结构化数据

和一般纯文本相比,半结构化数据具备肯定的结构性,但和具备严格理论模型的关系数据库的数据相比。OEM(Object exchange Model)是一种典型的半结构化数据模型。

半结构化数据(百度竞价推广i-structured data)

在做一个信息管理软件设计时一定会涉及到数据的存储,通常大家都会将系统信息保存在某个指定的关系数据库中。大家会将数据按业务分类,并设计相应的表,然后将对应的信息保存到相应的表中。譬如大家做一个业务系统,要保存职员基本信息:工号、名字、性别、出过生日期等等;大家就会打造一个对应的staff表。

但不是系统中所有信息都可以如此容易的用一个表中的字段就能对应的。

十6、非结构化数据

非结构化数据库是指其字段长度可变,并且每一个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅能够处置结构化数据(如数字、符号等信息)而且更合适处置非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。

十7、数据库(Database)

数据库是根据数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,伴随信息技术和市场的进步,尤其是二十世纪九十年代将来,数据管理不再只是存储和管理数据,而转变成用户所需要的各种数据管理的方法。数据库有非常多种种类,从最容易的存储有各种数据的表格到可以进行大量数据存储的大型数据库系统都在每个方面得到了广泛的应用。

十8、数据剖析

英文名:Data Analysis

数据剖析是指用适合的统计剖析办法对采集来的很多数据进行剖析,提取有用信息和形成结论而对数据加以详细研究和概括概要的过程。这一过程也是水平管理体系的支持过程。在实用中,数据剖析可帮大家作出判断,以便采取适合行动。

Excel作为常见的剖析工具,可以达成基本的剖析工作,在商业智能范围Cognos、Style Intelligence、Microstrategy、Brio、BO和Oracle与国内商品如Yonghong Z-Suite BI套件等。

十9、数据挖掘

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库常识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘通常是指从很多的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘一般与计算机科学有关,并通过统计、在线剖析处置、情报检索、机器学习、专家系统(依赖过去的经验法则)和模式辨别等很多办法来达成上述目的。

二10、数据清洗

数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可辨别的错误的最后一道程序,包含检查数据一致性,处置无效值和缺失值等。由于数据仓库中的数据是面向某一主题的数据的集合,这类数据从多个业务系统中抽取而来而且包括历史数据,如此就无法避免有些数据是错误数据、有些数据相互之间有冲突,这类错误的或有冲突的数据显然是大家不想要的,称为“脏数据”。大家要根据肯定的规则把“脏数据”“洗掉”,这就是数据清洗。而数据清洗的任务是过滤那些不符合需要的数据,将过滤的结果交给业务主管部门,确认是不是过滤掉还是由业务单位修正之后再进行抽取。不符合需要的数据主如果有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理通常是由计算机而不是人工完成。

二十1、可视化

可视化(Visualization)是借助计算机图形学和图像处置技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处置的理论、办法和技术。它涉及到计算机图形学、图像处置、计算机视觉、计算机辅助设计等多个范围,成为研究数据表示、数据处置、决策剖析等一系列问题的综合技术。现在正在快速进步的虚拟现实技术也是以图形图像的可视化技术为依托的。

二十2、数据可视化

英文名:Data visualization

数据可视化技术的基本思想是将数据库中每个数据项作为单个图元元素表示,很多的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不一样的维度察看数据,从而对数据进行更深入的察看和剖析。

数据可视化主要旨在借用于图形化方法,明确有效地传达与交流信息。但,这并不就意味着,数据可视化就肯定由于要达成其功可以用途而让人感到枯燥乏味,或者是为了看起来绚丽多彩而看上去极端复杂。为了有效地传达思想定义,美学形式与功能需要齐头并进,通过直观地传达重要的方面与特点,从而达成对于相当稀疏而又复杂的数据集的深入洞察

然而,设计职员总是并不可以非常不错地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,没办法达到其主要目的,也就是传达与交流信息。

二十3、商品数据管理

商品数据管理(Product Data Management)是基于分布式互联网、主从结构、图形化用户接口和数据库件管理技术进步起来的一种软件框架(或数据平台),PDM对并行工程中的职员工具、设施资源、商品数据与数据生成过程进行全方位管理。

二十4、DSP(需要方平台)

DSP(Demand-Side Platform),就是需要方平台。这一定义起来自于网络媒体广告发达的欧美,是随着着网络和广告业的快速进步新兴起的网络媒体广告范围。它与Ad Exchange和RTB一块飞速崛起于美国,已在全球迅速进步,2011年已经覆盖到了欧美、亚太与澳洲。在世界互联网展示广告范围,DSP方兴未艾。DSP传入中国,飞速成为热潮,成为推进中国互联网展示广告RTB市场迅速进步的动力之一。

二十5、DMP(数据管理平台)

DMP(Data-Management Platform)数据管理平台,是把分散的1、第三方数据进行整理纳入统一的技术平台,并对这类数据进行标准化和细分,让用户可以把这类细分结果推向现有些互动推广环境里。

DMP的核心元素包含:

·数据整理及标准化能力:使用统一化的方法,将各方数据吸纳整理。

·数据细分管理能力:创建出与众不同、有意义的顾客细分,进行有效营销推广活动。

·功能完善的数据标签:提供数据标签灵活性,便于营销推广活动的用。

·自助式的用户界面:基于网页web界面或其他集成策略直接获得数据工具,功能和几种形式报表和剖析。

·有关途径环境的连接:跟有关途径的集成,包括网站端、展示广告、电子邮件与搜索和视频,让推广者能找到、定位和提供细分群体有关高度的推广信息。

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:375750496@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。