日志分析常见应用及场景调研笔记

Table of Contents

1 创业公司分析

1.1 Sumologic

1.1.1 数据

Sumologic的原始数据为: 日志数据

1.1.2 应用场景

官网上是这样解释机器学习的应用场景1: Machine learning applies adaptive algorithms to cluster patterns in your data and surfaces anomalies.

理解过来,Sumologic的应用场景应该是:

  • 找到异常点(异常检测)
  • 从数据中找到异常相关的数据

1.1.3 应用挑战

  • 数据并非结构化的,想要直接解析日志数据很难。解决办法:应用机器学习去发现模式、探测异常点并且比较时间周期。
  • 指数级的数据增长
  • 不具备自适应能力:很多工具都不能学习历史模式,并且要求人工参与才能获取到比较好的结果

1.1.4 有什么用?

  • 根据用户的行为模式(包括季节性和周期性)确定应用程序开发工作的优先级。
  • 基于多维比较,模式发现和异常检测,快速定位问题
  • 快速发现安全威胁并了解威胁的优先级,并且无需人工参与

1.1.5 使用的技术

  • 聚类: 挖掘模式并且从非大量非结构化的数据中发现异常
  • Baselining: 定义并发现用户行为或统计学上的baseline, 并且能够实时和这些baseline进行比较
  • 统计分析: 依据统计学来发现异常点
  • 回归分析: 拟合过去数据,预测未来走势

1.1.6 展现

  • logReduce: logReduce的作用是从非结构化的数据中发现某些数据结构,并将这些数据聚合起来。同时还允许用户下砖数据。
  • logCompare: logCompare允许用户选取两个不同时间段,比较这两个时间段中的 模式增加/减少情况

1.2 神策数据

Footnotes:

Author: Marcnuth

Last Updated: 2017-05-26 Fri 17:00