eis/eqpalg/doc/数据精确度策略.md

12 lines
586 B
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 数据精确度策略
统计大概的数据分布情况
精确到0.1的数据,除起始情况之外,如果数据量短时间增幅太大(delta_count/week > 500)
就降低精确度4倍
直到单周数据增幅小于等于500
如果数据增量出现异常周即数据增量稳定之后突然某周出现了超过1000的增量信息
则进行报警
如果数据总数已经超过了10w条则对数据进行精确度重新定位每次降低精确度2倍、
当得到每个数据的数据分布信息后,对数据总量进行缩放,并对数据进行随机化填充