Unsubscribe
该讨论串仅涉及用户 Subhasis Mukherjee 多次发送及转发“Unsubscribe”邮件,请求退出 Spark 社区邮件列表。邮件内容无实质性技术讨论,仅为重复的退订请求操作。
@Subhasis Mukherjee: 请求从 Spark 开发邮件列表中退订。
邮件中未体现具体结论或社区回应,此类请求通常需通过邮件列表管理界面或页脚链接处理,而非向列表地址发信。
2026-03-30 ~ 2026-04-05
该讨论串仅涉及用户 Subhasis Mukherjee 多次发送及转发“Unsubscribe”邮件,请求退出 Spark 社区邮件列表。邮件内容无实质性技术讨论,仅为重复的退订请求操作。
@Subhasis Mukherjee: 请求从 Spark 开发邮件列表中退订。
邮件中未体现具体结论或社区回应,此类请求通常需通过邮件列表管理界面或页脚链接处理,而非向列表地址发信。
Alexandros Biratsis 发布了一个名为 stopstreaming 的库,旨在通过外部信号优雅地停止 Spark Structured Streaming 作业。该库通过扩展 StreamingQuery 接口,目前支持 REST 和 FileSystem 两种触发方式,并计划未来支持 Kafka 等更多监视器。
@Alexandros Biratsis: 该库利用 Spark 现有 API(StreamingQueryListener)扩展了 StreamingQuery,允许通过 REST 或文件系统标记文件接收外部停止信号。
@Alexandros Biratsis: 未来计划增加对 Kafka 和 Azure Service Bus 的支持,并征求社区关于该功能是否应增强或扩展 Spark API 的建议。
作者正在征求社区反馈,以评估该库的实用性及是否适合集成到 Spark API 中,后续将根据建议增加更多功能。
讨论主要关于将 SPARK-53759(Python 3.12+ Windows 崩溃)的修复回移植至活跃分支(4.1, 4.0, 3.5)。Antonio Blanco 建议采用最小化修复方案而非移植大型重构代码,Yicong Huang 对此表示支持并建议提交简洁的 PR。
@Antonio Blanco: 提议进行最小化修复回移植(在 socket 关闭前添加 flush()),因为 master 分支上的原始修复涉及 14 个文件的重构,难以直接移植。
@Yicong Huang: 支持最小化回移植的想法,建议准备并保持 PR 简洁以便更容易通过审查。
初步达成共识采用最小化修复方案,下一步行动是准备并向社区提交具体的回移植 PR 以供审核。
本讨论旨在为 Spark Connect 协议引入能力发现与协商机制,解决客户端无法预知服务器支持功能的问题。提案建议新增 GetServerCapabilities RPC,使客户端能在连接时查询服务器支持的协议特性,从而避免运行时因版本不匹配导致的功能不支持错误。
@Devin Petersohn: Spark Connect 目前缺乏机制让客户端发现服务器支持的功能,导致客户端仅在运行时失败时才发现不兼容。
@Devin Petersohn: 提议新增 GetServerCapabilities RPC,允许客户端在连接时查询服务器支持的运算符、函数和数据类型等。
@Devin Petersohn: 该方案参考了 JDBC 的 DatabaseMetaData 和 Flight SQL 的 GetSqlInfo 模式。
目前处于提案讨论阶段,作者邀请社区查阅 JIRA 和 SPIP 文档并提供反馈。
Xiaoxuan Li 发起了一项 SPIP 讨论,提议在 Spark SQL 中增加纳秒级时间戳支持,以解决当前微秒精度在处理纳秒 Parquet 文件和 Iceberg V3 时的局限性。提案建议新增两种内部存储为 INT64 的单例类型,并引入 TIMESTAMP(p) 语法,同时确保与现有类型的二进制兼容性。该方案通过采用行业标准格式解决了过往关于存储和类型混淆的反馈。
@Xiaoxuan Li: 提议新增 TimestampNanosType 和 TimestampNTZNanosType,内部使用 INT64 表示纳秒,以兼容 Parquet、Arrow 和 Iceberg V3。
@Xiaoxuan Li: 建议采用 TIMESTAMP(p) 语法,并保持现有 TimestampType 为单例,避免破坏二进制兼容性。
@Xiaoxuan Li: 通过使用 INT64 标准格式和固定精度单例,解决了之前讨论中关于存储开销和类型混淆的问题。
目前处于提案征集意见阶段,下一步需要社区审阅 SPIP 文档并针对具体实现细节进行反馈。
本周新建 0 个 Issue
本周无新建 JIRA。