诊断日志知多少 | DiagnosticSource 在.NET上的应用
1. 引言
最近为了解决ABP集成CAP时无法通过拦截器启用工作单元的问题,从小伙伴那里学了一招。借助DiagnossticSource
,可以最小改动完成需求。关于DiagnosticSource晓东大佬18年在文章 在 .NET Core 中使用 Diagnostics (Diagnostic Source) 记录跟踪信息就有介绍,文章开头就说明了Diagnostics 一直是一个被大多数开发者忽视的东西。是的,我也忽略了,这个好东西,有必要学习一下,下面就和大家简单聊一聊System.Diagnostics.DiagnosticSource在.NET上的应用。
2. System.Diagnostics.DiagnosticSource
Diagnostics
位于System
命名空间下,由此可见Diagnostics
在.NET 运行时中的地位不可小觑。其中System.Diagnostics命名空间下又包含不同类库,提供了允许与系统进程,事件日志和性能计数器进行交互的类。如下图所示:
其中System.Diagnostics.DiagnosticSource模块,它允许对代码进行检测,以在生产时记录丰富的数据负载(可以传递不可序列化的数据类型),以便在进程内进行消耗。消费者可以在运行时动态发现数据源并订阅感兴趣的数据源。
在展开之前,有必要先梳理下涉及的以下核心概念:
IObservable:可观测对象 IObserver:观察者 DiagnosticSource :诊断来源 DiagnosticListener:诊断监听器 Activity:活动
3. 观察者模式(IObservable & IObserver)
IObservable
和IObserver
位于System
命名空间下,是.NET中对观察者模式的抽象。
观察者设计模式使观察者能够从可观察对象订阅并接收通知。 它适用于需要基于推送通知的任何方案。 此模式定义可观察对象,以及零个、一个或多个观察者。 观察者订阅可观察对象,并且每当预定义的条件、事件或状态发生更改时,该可观察对象会通过调用其方法之一来自动通知所有观察者。 在此方法调用中,该可观察对象还可向观察者提供当前状态信息。 在 .NET Framework 中,通过实现泛型 System.IObservable 和 System.IObserver 接口来应用观察者设计模式。泛型类型参数表示提供通知信息的类型。 泛型类型参数表示提供通知信息的类型。
第一次学习观察者模式,应该是大学课本中基于事件烧水的例子,咱们就基于此实现个简单的Demo吧。首先执行dotnet new web -n Dotnet.Diagnostic.Demo
创建示例项目。
3.1. 定义可观察对象(实现IObservable接口)
对于烧水的示例,主要关注水温的变化,因此先定义Temperature
来表示温度变化:
public class Temperature
{
public Temperature(decimal temperature, DateTime date)
{
Degree = temperature;
Date = date;
}
public decimal Degree { get; }
public DateTime Date { get; }
}
接下来通过实现IObservable
接口来定义可观察对象。
public interface IObservable
{
IDisposable Subscribe(IObserver observer);
}
从接口申明来看,只定义了一个Subscribe
方法,从观察者模式讲,观察者应该既能订阅又能取消订阅消息。为什么没有定义一个UnSubscribe
方法呢?其实这里方法申明已经说明,期望通过返回IDisposable
对象的Dispose
方法来达到这个目的。
///
/// 热水壶
///
public class Kettle : IObservable
{
private List> observers;
private decimal temperature = 0;
public Kettle()
{
observers = new List>();
}
public decimal Temperature
{
get => temperature;
private set
{
temperature = value;
observers.ForEach(observer => observer.OnNext(new Temperature(temperature, DateTime.Now)));
if (temperature == 100)
observers.ForEach(observer => observer.OnCompleted());
}
}
public IDisposable Subscribe(IObserver observer)
{
if (!observers.Contains(observer))
{
Console.WriteLine("Subscribed!");
observers.Add(observer);
}
//使用UnSubscriber包装,返回IDisposable对象,用于观察者取消订阅
return new UnSubscriber(observers, observer);
}
///
/// 烧水方法
///
public async Task StartBoilWaterAsync()
{
var random = new Random(DateTime.Now.Millisecond);
while (Temperature < 100)
{
Temperature += 10;
await Task.Delay(random.Next(5000));
}
}
}
//定义泛型取消订阅对象,用于取消订阅
internal class UnSubscriber : IDisposable
{
private List> _observers;
private IObserver _observer;
internal UnSubscriber(List> observers, IObserver observer)
{
this._observers = observers;
this._observer = observer;
}
public void Dispose()
{
if (_observers.Contains(_observer))
{
Console.WriteLine("Unsubscribed!");
_observers.Remove(_observer);
}
}
}
以上代码中List
3.2. 定义观察者(实现IObserver接口)
比如定义一个报警器,实时播报温度。
public class Alter : IObserver
{
public void OnCompleted()
{
Console.WriteLine("du du du !!!");
}
public void OnError(Exception error)
{
//Nothing to do
}
public void OnNext(Temperature value)
{
Console.WriteLine($"{value.Date.ToString()}: Current temperature is {value.Degree}.");
}
}
添加测试代码,访问localhost:5000/subscriber
控制台输出结果如下:
endpoints.MapGet("/subscriber", async context =>
{
var kettle = new Kettle();//初始化热水壶
var subscribeRef = kettle.Subscribe(new Alter());//订阅
var boilTask = kettle.StartBoilWaterAsync();//启动开始烧水任务
var timoutTask = Task.Delay(TimeSpan.FromSeconds(15));//定义15s超时任务
//等待,如果超时任务先返回则取消订阅
var firstReturnTask = await Task.WhenAny(boilTask, timoutTask);
if (firstReturnTask == timoutTask)
subscribeRef.Dispose();
await context.Response.WriteAsync("Hello subscriber!");
});
------------------------------------------------------------------
Subscribed!
10/2/2020 4:53:20 PM: Current temperature is 10.
10/2/2020 4:53:20 PM: Current temperature is 20.
10/2/2020 4:53:21 PM: Current temperature is 30.
10/2/2020 4:53:21 PM: Current temperature is 40.
10/2/2020 4:53:24 PM: Current temperature is 50.
10/2/2020 4:53:25 PM: Current temperature is 60.
10/2/2020 4:53:26 PM: Current temperature is 70.
10/2/2020 4:53:30 PM: Current temperature is 80.
Unsubscribed!
4. DiagnosticSource & DiagnosticListener
4.1. 概念讲解
DiagnosticSource
直译就是诊断源,也就是它是诊断日志的来源入口。DiagnosticSource是一个抽象类主要定义了以下方法:
//Provides a generic way of logging complex payloads
public abstract void Write(string name, object value);
//Verifies if the notification event is enabled.
public abstract bool IsEnabled(string name);
DiagnosticListener
直译就是诊断监听器,继承自DiagnosticSource
,同时实现了IObservable
接口,因此其本质是一个可观察对象。小结以下:
DiagnosticSource
作为诊断日志来源,提供接口,用于写入诊断日志。诊断日志的可观察数据类型为 KeyValuePair
。DiagnosticListener
继承自DiagnosticSource
,作为可观察对象,可由其他观察者订阅,以获取诊断日志。
DiagnosticListener
其构造函数接收一个name
参数。
private static DiagnosticSource httpLogger = new DiagnosticListener("System.Net.Http");
可以通过下面这种方式记录诊断日志:
if (httpLogger.IsEnabled("RequestStart"))
httpLogger.Write("RequestStart", new { Url="http://clr", Request=aRequest });
然后需要实现IObserver
接口,以便消费诊断数据。定义DiagnosticObserver
,进行诊断日志消费:
public class DiagnosticObserver : IObserver>
{
public void OnCompleted()
{
//Noting to do
}
public void OnError(Exception error)
{
Console.WriteLine($"{error.Message}");
}
public void OnNext(KeyValuePair pair)
{
// 这里消费诊断数据
Console.WriteLine($"{pair.Key}-{pair.Value}");
}
}
ASP.NET Core 项目中默认就依赖了System.Diagnostics.DiagnosticSource
Nuget包,同时在构建通用Web主机时,就注入了名为Microsoft.AspNetCore
的DiagnosticListener
。
//GenericWebHostBuilder.cs
DiagnosticListener instance = new DiagnosticListener("Microsoft.AspNetCore");
services.TryAddSingleton(instance);
services.TryAddSingleton((DiagnosticSource) instance);
因此我们可以直接通过注入DiagnosticListener
进行诊断日志的订阅:
public void Configure(IApplicationBuilder app, IWebHostEnvironment env, DiagnosticListener diagnosticListener)
{
diagnosticListener.Subscribe(new DiagnosticObserver());//订阅诊断日志
}
当然也可以直接使用DiagnosticListener.AllListeners.Subscribe(IObserver
进行订阅,不过区别是,接收的参数类型为IObserver
。
运行项目输出:
Microsoft.AspNetCore.Hosting.HttpRequestIn.Start-Microsoft.AspNetCore.Http.DefaultHttpContext
Microsoft.AspNetCore.Hosting.BeginRequest-{ httpContext = Microsoft.AspNetCore.Http.DefaultHttpContext, timestamp = 7526300014352 }
Microsoft.AspNetCore.Routing.EndpointMatched-Microsoft.AspNetCore.Http.DefaultHttpContext
Microsoft.AspNetCore.Hosting.EndRequest-{ httpContext = Microsoft.AspNetCore.Http.DefaultHttpContext, timestamp = 7526300319214 }
Microsoft.AspNetCore.Hosting.HttpRequestIn.Stop-Microsoft.AspNetCore.Http.DefaultHttpContext
从中可以看出,ASP.NET Core Empty Web Project在一次正常的Http请求过程中分别在请求进入、请求处理、路由匹配都埋了点,除此之外还有请求异常、Action处理都有埋点。因此,根据需要,可以实现比如请求拦截、耗时统计等系列操作。
4.2. 耗时统计
基于以上知识,下面尝试完成一个简单的耗时统计。从上面的内容可知,ASP.NET Core在BeginRequest和EndRequest返回的诊断数据类型如下所示:
Microsoft.AspNetCore.Hosting.BeginRequest-{ httpContext = Microsoft.AspNetCore.Http.DefaultHttpContext, timestamp = 7526300014352 }
Microsoft.AspNetCore.Hosting.EndRequest-{ httpContext = Microsoft.AspNetCore.Http.DefaultHttpContext, timestamp = 7526300319214 }
因此只要拿到两个timestamp就可以直接计算耗时,修改DiagnosticObserver
的OnNext
方法如下:
private ConcurrentDictionary startTimes = new ConcurrentDictionary();
public void OnNext(KeyValuePair pair)
{
//Console.WriteLine($"{pair.Key}-{pair.Value}");
//获取httpContext
var context = pair.Value.GetType().GetTypeInfo().GetDeclaredProperty("httpContext")
?.GetValue(pair.Value) as DefaultHttpContext;
//获取timestamp
var timestamp = pair.Value.GetType().GetTypeInfo().GetDeclaredProperty("timestamp")
?.GetValue(pair.Value) as long?;
switch (pair.Key)
{
case "Microsoft.AspNetCore.Hosting.BeginRequest":
Console.WriteLine($"Request {context.TraceIdentifier} Begin:{context.Request.GetUri()}");
startTimes.TryAdd(context.TraceIdentifier, timestamp.Value);//记录请求开始时间
break;
case "Microsoft.AspNetCore.Hosting.EndRequest":
startTimes.TryGetValue(context.TraceIdentifier, out long startTime);
var elapsedMs = (timestamp - startTime) / TimeSpan.TicksPerMillisecond;//计算耗时
Console.WriteLine(
$"Request {context.TraceIdentifier} End: Status Code is {context.Response.StatusCode},Elapsed {elapsedMs}ms");
startTimes.TryRemove(context.TraceIdentifier, out _);
break;
}
}
输出如下,大功告成:
Request 0HM37UNERKGF0:00000001 Begin:https://localhost:44330
Request 0HM37UNERKGF0:00000001 End: Status Code is 200,Elapsed 38ms
上面有通过反射去获取诊断数据属性的代码(var timestamp = pair.Value.GetType().GetTypeInfo().GetDeclaredProperty("timestamp") ?.GetValue(pair.Value) as long?;
),非常不优雅。但我们可以安装**Microsoft.Extensions.DiagnosticAdapter
**包来简化诊断数据的消费。安装后,添加HttpContextDiagnosticObserver
,通过添加DiagnosticName
指定监听的诊断名称,即可进行诊断数据消费。
public sealed class HttpContextDiagnosticObserver
{
private ConcurrentDictionary startTimes = new ConcurrentDictionary();
[DiagnosticName("Microsoft.AspNetCore.Hosting.BeginRequest")]
public void BeginRequest(HttpContext httpContext,long timestamp)
{
Console.WriteLine($"Request {httpContext.TraceIdentifier} Begin:{httpContext.Request.GetUri()}");
startTimes.TryAdd(httpContext.TraceIdentifier, timestamp);//记录请求开始时间
}
[DiagnosticName("Microsoft.AspNetCore.Hosting.EndRequest")]
public void EndRequest(HttpContext httpContext,long timestamp)
{
startTimes.TryGetValue(httpContext.TraceIdentifier, out long startTime);
var elapsedMs = (timestamp - startTime) / TimeSpan.TicksPerMillisecond;//计算耗时
Console.WriteLine(
$"Request {httpContext.TraceIdentifier} End: Status Code is {httpContext.Response.StatusCode},Elapsed {elapsedMs}ms");
startTimes.TryRemove(httpContext.TraceIdentifier, out _);
}
}
然后使用SubscribeWithAdapter
进行订阅即可。
public void Configure(IApplicationBuilder app, IWebHostEnvironment env, DiagnosticListener diagnosticListener)
{
// diagnosticListener.Subscribe(new DiagnosticObserver());
diagnosticListener.SubscribeWithAdapter(new HttpContextDiagnosticObserver());
}
到这里可能也有小伙伴说,我用ActionFilter
也可以实现,没错,但这两种方式是完全不同的,DiagnosticSource
是完全异步的。
4.3. 应用场景思考
根据DiagnosticSource的特性,可以运用于以下场景 :
AOP:因为Diagnostics命名事件一般是成对出现的,因此可以做些拦截操作。比如在Abp集成Cap时,若想默认启用Uow,就可以消费
DotNetCore.CAP.WriteSubscriberInvokeBefore
命名事件,创建Uow,再在命名事件DotNetCore.CAP.WriteSubscriberInvokeAfter
中提交事务,并Dispose。APM:SkyAPM-dotnet的实现就是通过消费诊断日志,进行链路跟踪。
EventBus:充分利用其发布订阅模式,可将其用于进程内事件的发布与消费。
5. Activity(活动)
5.1. Activity 概述
那Activity又是何方神圣,用于解决什么问题呢?关于Activity官方只有一句简要介绍:Represents an operation with context to be used for logging。(表示包含上下文的操作,用于日志记录。)
Activity用来存储和访问诊断上下文,并由日志系统进行消费。当应用程序开始处理操作时,例如HTTP请求或队列中的任务,它会在处理请求时创建Activity以在系统中跟踪该Activity。Activity中存储的上下文可以是HTTP请求路径,方法,用户代理或关联ID:所有重要信息都应与每个跟踪一起记录。当应用程序调用外部依赖关系以完成操作时,它可能需要传递一些上下文(例如,关联ID)以及依赖关系调用,以便能够关联来自多个服务的日志。
先来看下Activity主要以下核心属性:
Tags(标签)
IEnumerable
- 表示与活动一起记录的信息。标签的好例子是实例/机器名称,传入请求HTTP方法,路径,用户/用户代理等。标签不传递给子活动。典型的标签用法包括添加一些自定义标签,并通过它们进行枚举以填充日志事件的有效负载。可通过> Tags { get; } Activity AddTag(string key, string value)
添加Tag,但不支持通过Key检索标签。Baggage(行李)
IEnumerable
- 表示要与活动一起记录并传递给其子项的信息。行李的例子包括相关ID,采样和特征标记。Baggage被序列化并与外部依赖项请求一起传递。典型的Baggage用法包括添加一些Baggage属性,并通过它们进行枚举以填充日志事件的有效负载。可通过> Baggage { get; } Activity AddBaggage(string key, string value)
添加Baggage。并通过string GetBaggageItem(string key)
获取指定Key的Baggage。OperationName(操作名称)
string OperationName { get; }
- 活动名称,必须在构造函数中指定。StartTimeUtc
DateTime StartTimeUtc { get; private set; }
- UTC格式的启动时间,如果不指定,则在启动时默认指定为DateTime.UtcNow
。可通过Activity SetStartTime(DateTime startTimeUtc)
指定。Duration
TimeSpan Duration { get; private set; }
- 如果活动已停止,则代表活动持续时间,否则为0。Id
string Id { get; private set; }
- 表示特定的活动标识符。过滤特定ID可确保您仅获得与操作中特定请求相关的日志记录。该Id在活动开始时生成。Id传递给外部依赖项,并被视为新的外部活动的[ParentId]。ParentId
string ParentId { get; private set; }
- 如果活动是根据请求反序列化的,则该活动可能具有进程中的[Parent]或外部Parent。ParentId和Id代表日志中的父子关系,并允许您关联传出和传入请求。RootId
string RootId { get; private set; }
- 代表根IdCurrent
static Activity Current { get; }
- 返回在异步调用之间流动的当前Activity。Parent
Activity Parent { get; private set; }
- 如果活动是在同一过程中从另一个活动创建的,则可以使用Partent
获得该活动。但是,如果“活动”是根活动或父项来自流程外部,则此字段可能为null。Start()
Activity Start()
- 启动活动:设置活动的Activity.Current和Parent,生成唯一的ID并设置StartTimeUtc(如果尚未设置)。Stop()
void Stop()
- 停止活动:设置活动的Activity.Current,并使用Activity SetEndTime(DateTime endTimeUtc)
或DateTime.UtcNow中提供的时间戳计算Duration。
另外DiagnosticSource
中也定义了两个相关方法:
StartActivity Activity StartActivity(Activity activity, object args)
- 启动给定的Activity,并将DiagnosticSource
事件消息写入OperationName.Start
格式的命名事件中。StopActivity void StopActivity(Activity activity, object args)
- 停止给定的Activity,并将DiagnosticSource
事件消息写入{OperationName}.Stop
格式的命名事件中。
5.2. Activity在ASP.NET Core中的应用
要想弄懂Activity,我们还是得向源码学习,看一下HostingApplicationDiagnostics的实现。首先来看下BeginRequst
中的StartActivity
方法。
private Activity StartActivity(HttpContext httpContext, out bool hasDiagnosticListener)
{
Activity activity = new Activity("Microsoft.AspNetCore.Hosting.HttpRequestIn");
hasDiagnosticListener = false;
IHeaderDictionary headers = httpContext.Request.Headers;
StringValues stringValues1;
if (!headers.TryGetValue(HeaderNames.TraceParent, out stringValues1))
headers.TryGetValue(HeaderNames.RequestId, out stringValues1);
if (!StringValues.IsNullOrEmpty(stringValues1))
{
activity.SetParentId((string) stringValues1);
StringValues stringValues2;
if (headers.TryGetValue(HeaderNames.TraceState, out stringValues2))
activity.TraceStateString = (string) stringValues2;
string[] commaSeparatedValues = headers.GetCommaSeparatedValues(HeaderNames.CorrelationContext);
if (commaSeparatedValues.Length != 0)
{
foreach (string str in commaSeparatedValues)
{
NameValueHeaderValue parsedValue;
if (NameValueHeaderValue.TryParse((StringSegment) str, out parsedValue))
activity.AddBaggage(parsedValue.Name.ToString(), parsedValue.Value.ToString());
}
}
}
this._diagnosticListener.OnActivityImport(activity, (object) httpContext);
if (this._diagnosticListener.IsEnabled("Microsoft.AspNetCore.Hosting.HttpRequestIn.Start"))
{
hasDiagnosticListener = true;
this.StartActivity(activity, httpContext);
}
else
activity.Start();
return activity;
}
从中可以看出,在ASP.NET Core 开始处理请求之前:
首先,创建了名为 Microsoft.AspNetCore.Hosting.HttpRequestIn
的Activity,该Activity首先尝试从HTTP请求头中获取TraceParent/euqstId作为当前Activity的ParentId,这个很显然,是用来链路跟踪的。其次,尝试从 CorrelationContext
中获取关联上下文信息,然后将其添加到创建的Activity的Baggage中,进行关联上下文的继续传递。然后,启动Activity,然后向Name为 Microsoft.AspNetCore.Hosting.HttpRequestIn.Start
中写入诊断日志。
这里大家可能有个疑问,这个关联上下文信息CorrelationContext
又是何时添加到Http请求头中的呢?在System.Net.Http
中的DiagnosticsHandler中添加的。因此我们应该明白了,整个关联上下文的传递机制。
紧接着再来看一看RequestEnd
中的StopActivity
方法。
private void StopActivity(Activity activity, HttpContext httpContext)
{
if (activity.Duration == TimeSpan.Zero)
activity.SetEndTime(DateTime.UtcNow);
this._diagnosticListener.Write("Microsoft.AspNetCore.Hosting.HttpRequestIn.Stop", (object) httpContext);
activity.Stop();
}
从中可以看出主要是先SetEndTime
,再写入Microsoft.AspNetCore.Hosting.HttpRequestIn.Stop
命名事件;最后调用Stop
方法停止当前Activity。
简单总结一下,借助Activity中附加的Baggage信息可以实现请求链路上上下文数据的共享。
5.3. 应用场景思考
从上面的命名事件中可以看出,其封送的数据类型是特定的,因此可以借助Activity的Tags或Baggage添加自定义的数据进行共享。
按照上面我们的耗时统计,只能统计到整个http请求的耗时,但对于我们定位问题来说还是有困难,比如,某个api即有调用redis,又操作了消息队列,同时又访问了数据库,那到底是那一段超时了呢?显然不好直接定位,借助activity,我们就可以很好的实现细粒度的链路跟踪。通过activity携带的信息,可以将一系列的操作关联起来,记录日志,再借助AMP进行可视化快速定位跟踪。
6. 参考资料
在 .NET Core 中使用 Diagnostics (Diagnostic Source) 记录跟踪信息 Logging using DiagnosticSource in ASP.NET Core .Net Core中的诊断日志DiagnosticSource讲解 Observer Design Pattern DiagnosticSource User Guide Activity User Guide DiagnosticSourcery 101 - Mark Rendle Improvements in .NET Core 3.0 for troubleshooting and monitoring distributed apps