共11篇
文章标签:MaxCompute
MaxCompute(ODPS)是适用于数据分析场景的企业级 SaaS(Software as a Service)模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效地分析处理海量数据。
PyODPS基本操作之DataFrame
PyODPS 提供了 DataFrame API,它提供了类似 Pandas 的接口,但是能充分利用 MaxCompute 的计算能力。同时能在本地使用同样的接口,用 Pandas 进行计算。
PyODPS 提供了 DataFrame API,它提供了类似 Pandas 的接口,但是能充分利用 MaxCompute...
PyODPS基本操作之表管理
PyODPS 支持对 MaxCompute 表的基本操作,包括创建表、创建表的 Schema、同步表更新、获取表数据、删除表、表分区操作以及如何将表转换为 DataFrame 对象。
PyODPS 支持对 MaxCompute 表的基本操作,包括创建表、创建表的 Schema、同步表更新、获取表数据、删除...
基于 MaxCompute 实现拉链表
拉链表是数据仓库设计中用来处理数据变化的一种技术,它允许保存历史数据,记录一个事物从开始到当前状态的所有变化信息,可以反映任意时间点数据的状态。本文将为您介绍基于 MaxCompute 引擎在 DataWorks 上实现拉链表 ETL 的案例。
拉链表是数据仓库设计中用来处理数据变化的一种技术,它允许保存历史数据,记录一个事物从开始到当前状态的所有变化信息,可以反映...
MaxCompute 分区操作
分区表是指拥有分区空间的表,即在创建表时指定表内的一个或者某几个字段作为分区列。分区表实际就是对应分布式文件系统上的独立的文件夹,一个分区对应一个文件夹,文件夹下是对应分区所有的数据文件。
分区表是指拥有分区空间的表,即在创建表时指定表内的一个或者某几个字段作为分区列。分区表实际就是对应分布式文件系统上的独立的...
- Django Web 开发 4
- Oracle 数据库开发 9
- Oracle 性能优化 12
- Python 基础知识 8
- 开发工具配置 5
- Oracle 数据库管理 2
- Python 搭建博客 1
- Oracle 索引技术 2
- Python 数据分析 6
- Hive 1
- MaxCompute 9
- MySQL 5
- Greenplum/AnalyticDB 8
- PyODPS 3