(工作流实现原理) 大数据 2025-03-01 23:12:05 编辑 考高分 取消关注 关注 私信 早上的工作就是把Spark清洗和写入数据这两个业务做一个区分 Job1是读取CSV -> 清洗数据 -> 写入parquet Job2是读取parquet ->写入Mysql中 因为数据量其实不是很大,因为可能是离线的项目,所以打算使用Spark+Mysql+Spring中的IO来实现简单的清洗 数据离线