上传示例数据和程序 本章节主要介绍翼MapReduce如何上传示例数据和程序。 用户通过“文件管理”页面可以在分析集群进行文件夹创建、删除,文件导入、导出、删除操作。 背景信息 翼MR集群处理的数据源来源于OBS或HDFS,OBS为客户提供海量、安全、高可靠、低成本的数据存储能力。翼MR可以直接处理OBS中的数据,客户可以基于管理控制台Web界面和OBS客户端对数据进行浏览、管理和使用。 导入数据 翼MR目前只支持将OBS上的数据导入至HDFS中。上传文件速率会随着文件大小的增大而变慢,适合数据量小的场景下使用。 支持导入文件和目录,操作方法如下: 1. 登录翼MR管理控制台。 2. 选择“集群列表 > 现有集群”,选中一集群并单击集群名进入集群信息页面。 3. 单击“文件管理”,进入“文件管理”页面。 4. 选择“HDFS文件列表”。 5. 进入数据存储目录,如“bdapp1”。 “bdapp1”目录仅为示例,可以是界面上的任何目录,也可以通过“新建”创建新的文件夹。 新建文件夹时需要满足以下要求: 文件夹名称小于等于255字符。 不允许为空。 不能包含 : /:?"<>;&,'!{}[]$%+特殊字符。 不能以“.”开头或结尾。 开头和末尾的空格会被忽略。 6. 单击“导入数据”,正确配置HDFS和OBS路径。配置OBS或者HDFS路径时,单击“浏览”并选择文件目录,然后单击“是”。