开发者
天翼云开发者社区
共 18 条
  • 1
  • 2
前往

vscode ssh 使用linux环境开发

vscode ssh 使用linux环境开发

数据治理之数据质量评估维度及方法

文中从数据治理的关注点,评估维度,校验方法及监控规则几个维度,介绍数据治理,在保证数据质量的目标下,开展治理工作

系统设计|数据摄取

本文简单介绍一下互联网中数据采集、数据转换、数据存储以及数据检索的流程

用浏览器实现数据分析自动化

随着企业加大对信息化建设的投入,逐步建立起生产管理、库存管理、销售管理等系统。如果缺少统一规划,各系统形成数据孤岛,很难进行数据统筹分析。即便是已经建立起统一规划的集成系统,但随着环境和需求变化,需要使用新的方法统计分析,修改维护系统成本太高。

体验NiFi数据处理流程

NiFi数据处理流程配置实现数据同步

Ansible入门

Ansible是一种自动化工具,用于配置和部署软件应用程序。它采用基于文本的配置语言,并使用SSH协议来管理远程主机上的配置

DistCp架构及内核机制

DistCp是Apache Hadoop提供的一个用于在分布式环境下高效复制大量数据的工具,其源代码在Hadoop源代码树的hadoop-tools/hadoop-distcp目录下,其中最主要的类是org.apache.hadoop.tools.DistCp。DistCp类的实例是distcp工具的入口,它提供了多种用于配置复制任务的方法,如设置源目录、目标目录、带宽限制、忽略文件列表等。本文将介绍DistCp的架构和内核机制,以便读者更好地理解这个重要的数据复制工具。

AI人工智能—数据标注的主要类型和标注注意事项

数据标注作为人工智能发展道路上的基石,是人工智能发展的重要环节。数据标注的过程是通过人工贴标签的方式,为机器提供可学习的样本数据,最终使机器可以自主识别数据。在深度学习模型的测试过程中,高质量的数据标注往往能更好地提高模型训练的质量。 数据标注类型主要包括图像标注、文本标注、语音标注和3D点云标注四大类。在标注过程中,为了确保标注数据的准确率,需要注意很多事项。

数据集成介绍:技术、方法与最佳实践

本文主要是对数据集成的技术、方法和场景做个入门介绍,包括介绍了数据集成批次数据集成和实时数据集成两种场景,介绍了ETL、数据仓库的概念和与数据集成的关系,介绍了数据集成的开发和运维方法,最后介绍了数据集成的最新发展趋势。

点击加载更多...
共 18 条
  • 1
  • 2
前往

vscode ssh 使用linux环境开发

vscode ssh 使用linux环境开发

数据治理之数据质量评估维度及方法

文中从数据治理的关注点,评估维度,校验方法及监控规则几个维度,介绍数据治理,在保证数据质量的目标下,开展治理工作

系统设计|数据摄取

本文简单介绍一下互联网中数据采集、数据转换、数据存储以及数据检索的流程

用浏览器实现数据分析自动化

随着企业加大对信息化建设的投入,逐步建立起生产管理、库存管理、销售管理等系统。如果缺少统一规划,各系统形成数据孤岛,很难进行数据统筹分析。即便是已经建立起统一规划的集成系统,但随着环境和需求变化,需要使用新的方法统计分析,修改维护系统成本太高。

体验NiFi数据处理流程

NiFi数据处理流程配置实现数据同步

Ansible入门

Ansible是一种自动化工具,用于配置和部署软件应用程序。它采用基于文本的配置语言,并使用SSH协议来管理远程主机上的配置

DistCp架构及内核机制

DistCp是Apache Hadoop提供的一个用于在分布式环境下高效复制大量数据的工具,其源代码在Hadoop源代码树的hadoop-tools/hadoop-distcp目录下,其中最主要的类是org.apache.hadoop.tools.DistCp。DistCp类的实例是distcp工具的入口,它提供了多种用于配置复制任务的方法,如设置源目录、目标目录、带宽限制、忽略文件列表等。本文将介绍DistCp的架构和内核机制,以便读者更好地理解这个重要的数据复制工具。

AI人工智能—数据标注的主要类型和标注注意事项

数据标注作为人工智能发展道路上的基石,是人工智能发展的重要环节。数据标注的过程是通过人工贴标签的方式,为机器提供可学习的样本数据,最终使机器可以自主识别数据。在深度学习模型的测试过程中,高质量的数据标注往往能更好地提高模型训练的质量。 数据标注类型主要包括图像标注、文本标注、语音标注和3D点云标注四大类。在标注过程中,为了确保标注数据的准确率,需要注意很多事项。

数据集成介绍:技术、方法与最佳实践

本文主要是对数据集成的技术、方法和场景做个入门介绍,包括介绍了数据集成批次数据集成和实时数据集成两种场景,介绍了ETL、数据仓库的概念和与数据集成的关系,介绍了数据集成的开发和运维方法,最后介绍了数据集成的最新发展趋势。

点击加载更多...