共15篇
文章标签:MaxCompute
MaxCompute(ODPS)是适用于数据分析场景的企业级 SaaS(Software as a Service)模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效地分析处理海量数据。

大数据SQL-查询前2大和前2小用户并有序拼接
已知有用户账户表,包含年份,用户ID和值,请按照年份分组,取出值前两小和前两大对应的用户ID。需要保持值最小和最大的用户ID排首位。
已知有用户账户表,包含年份,用户ID和值,请按照年份分组,取出值前两小和前两大对应的用户ID。需要保持值最小和最大的用户I...

大数据SQL-截止目前登陆用户数及登陆用户列表
已知有用户登录记录表,包含登录日期和登录用户ID,请查询出截止到最新日期累积登录用户数、所有用户累积登录次数、登陆用户列表。
已知有用户登录记录表,包含登录日期和登录用户ID,请查询出截止到最新日期累积登录用户数、所有用户累积登录次数、登陆用户列表。

MaxCompute 复杂类型函数之 ARRAY 函数
在 MaxCompute SQL 中可以使用复杂类型函数处理复杂数据类型,例如 ARRAY、MAP、STRUCT、JSON。
在 MaxCompute SQL 中可以使用复杂类型函数处理复杂数据类型,例如 ARRAY、MAP、STRUCT、JSON。

大数据SQL-统计连续5天涨幅超过5%的股票
现有一张股票价格表 stock_data 有三个字段分别是股票代码(stock_code)、日期(trade_date)、收盘价格(closing_price) ,请找出满足连续5天以上(含)每天上涨超过5%的股票,并给出连续满足天数及开始和结束日期。
现有一张股票价格表 stock_data 有三个字段分别是股票代码(stock_code)、日期(trade_date)、...

PyODPS基本操作之DataFrame
PyODPS 提供了 DataFrame API,它提供了类似 Pandas 的接口,但是能充分利用 MaxCompute 的计算能力。同时能在本地使用同样的接口,用 Pandas 进行计算。
PyODPS 提供了 DataFrame API,它提供了类似 Pandas 的接口,但是能充分利用 MaxCompute...

PyODPS基本操作之表管理
PyODPS 支持对 MaxCompute 表的基本操作,包括创建表、创建表的 Schema、同步表更新、获取表数据、删除表、表分区操作以及如何将表转换为 DataFrame 对象。
PyODPS 支持对 MaxCompute 表的基本操作,包括创建表、创建表的 Schema、同步表更新、获取表数据、删除...

基于 MaxCompute 实现拉链表
拉链表是数据仓库设计中用来处理数据变化的一种技术,它允许保存历史数据,记录一个事物从开始到当前状态的所有变化信息,可以反映任意时间点数据的状态。本文将为您介绍基于 MaxCompute 引擎在 DataWorks 上实现拉链表 ETL 的案例。
拉链表是数据仓库设计中用来处理数据变化的一种技术,它允许保存历史数据,记录一个事物从开始到当前状态的所有变化信息,可以反映...
- Django Web 开发 4
- Oracle 数据库开发 9
- Oracle 性能优化 12
- Python 基础知识 8
- 开发工具配置 5
- Oracle 数据库管理 2
- Oracle 索引技术 2
- Python 数据分析 6
- Hive 1
- DataWorks/MaxCompute 15
- MySQL 5
- Greenplum/AnalyticDB 8
- PyODPS 3
- 数据湖仓 10