阅读307 返回首页    go iPhone_iPad_Mac_手机_平板_苹果apple


producer-lib__loghub-采集_用户指南_日志服务-阿里云

LogHub Producer Library是针对Java应用程序高并发写LogHub类库,Producer Library和Consumer Library是对LogHub读写包装,降低数据收集与消费的门槛。

LogHub Producer Library解决的问题:

  1. 客户端日志不落盘:既数据产生后直接通过网络发往服务端。
  2. 客户端高并发写入:例如一秒钟会有百次以上写操作。
  3. 客户端计算与IO逻辑分离:打日志不影响计算耗时。

在以上场景中,Producer Library会简化你程序开发的代价,帮助你批量聚合写请求,通过异步的方式发往LogHub服务端。在整个过程中,用户可以配置批量聚合的参数,服务端异常处理的逻辑等。

0c5e22da184eec0f93979cec8ff159394b1143e0

以上各种接入方式的对比:

接入方式 优点/缺点 针对场景
日志落盘+Logtail 日志收集与打日志解耦,无需修改代码 常用场景
Syslog + Logtail 性能较好(80MB/S),日志不落盘,需支持syslog协议 Syslog场景
SDK直发 不落盘,直接发往服务端,需要处理好网络IO与程序IO之间的切换 日志不落盘
Producer Library 不落盘,异步合并发送服务端,吞吐量较好 日志不落盘,客户端QPS高

(目前Producer Library只支持Java 版本,其他语言待开发)

LogHub Producer Library功能

  1. 提供异步的发送接口,线程安全。
  2. 可以添加多个project的配置。
  3. 用于发送的网络IO线程数量可以配置。
  4. merge成的包的日志数量以及大小都可以配置。
  5. 内存使用可控,当内存使用达到用户配置的阈值时,producer的send接口会阻塞,直到有空闲的内存可用。

使用方法

producer使用分为以下几个步骤:

step 1: maven工程中添加依赖:

  1. <dependency>
  2. <groupId>com.aliyun.openservices</groupId>
  3. <artifactId>log-loghub-producer</artifactId>
  4. <version>0.1.4</version>
  5. </dependency>

step 2:程序中配置ProducerConfig,其中各个参数说明如下。

  1. public class ProducerConfig
  2. {
  3. //被缓存起来的日志的发送超时时间,如果缓存超时,则会被立即发送,单位是毫秒
  4. public int packageTimeoutInMS = 3000;
  5. //每个缓存的日志包中包含日志数量的最大值,不能超过4096
  6. public int logsCountPerPackage = 4096;
  7. //每个缓存的日志包的大小的上限,不能超过5MB,单位是字节
  8. public int logsBytesPerPackage = 5 * 1024 * 1024;
  9. //单个producer实例可以使用的内存的上限,单位是字节
  10. public int memPoolSizeInByte = 1000 * 1024 * 1024;
  11. //IO线程池最大线程数量,主要用于发送数据到日志服务
  12. public int maxIOThreadSizeInPool = 50;
  13. //当使用指定shardhash的方式发送日志时,这个参数需要被设置,否则不需要关心。后端merge线程会将映射到同一个shard的数据merge在一起,而shard关联的是一个hash区间,
  14. //producer在处理时会将用户传入的hash映射成shard关联hash区间的最小值。每一个shard关联的hash区间,producer会定时从从loghub拉取,该参数的含义是每隔shardHashUpdateIntervalInMS毫秒,
  15. //更新一次shard的hash区间。
  16. public int shardHashUpdateIntervalInMS = 10 * 60 * 1000;
  17. //如果发送失败,重试的次数,如果超过该值,就会将异常作为callback的参数,交由用户处理。
  18. public int retryTimes = 3;
  19. }

step 3:继承ILogCallback,callback主要用于日志发送结果的处理,结果包括发送成功和发生异常。用户也可以选择不处理,这样就不需要继承ILogCallback。

step 4:创建producer实例,调用send接口发数据。

下面是一个完整的示例。

示例

main:

  1. public class ProducerSample {
  2. private final static int ThreadsCount = 25;
  3. public static String RandomString(int length) {
  4. String str = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
  5. Random random = new Random();
  6. StringBuffer buf = new StringBuffer();
  7. for (int i = 0; i < length; i++) {
  8. int num = random.nextInt(62);
  9. buf.append(str.charAt(num));
  10. }
  11. return buf.toString();
  12. }
  13. public static void main(String args[]) throws InterruptedException {
  14. ProducerConfig producerConfig = new ProducerConfig();
  15. //使用默认配置创建producer实例
  16. final LogProducer producer = new LogProducer(producerConfig);
  17. // 添加多个project配置
  18. producer.setProjectConfig(new ProjectConfig("your project 1",
  19. "endpoint", "your accesskey id", "your accesskey"));
  20. producer.setProjectConfig(new ProjectConfig("your project 2",
  21. "endpoint", "your accesskey id", "your accesskey",
  22. "your sts token"));
  23. // 更新project 1的配置
  24. producer.setProjectConfig(new ProjectConfig("your project 1",
  25. "endpoint", "your new accesskey id", "your new accesskey"));
  26. // 删除project 2的配置
  27. producer.removeProjectConfig("your project 2");
  28. // 生成日志集合,用于测试
  29. final Vector<Vector<LogItem>> logGroups = new Vector<Vector<LogItem>>();
  30. for (int i = 0; i < 100000; ++i) {
  31. Vector<LogItem> tmpLogGroup = new Vector<LogItem>();
  32. LogItem logItem = new LogItem((int) (new Date().getTime() / 1000));
  33. logItem.PushBack("level", "info" + System.currentTimeMillis());
  34. logItem.PushBack("message", "test producer send perf "
  35. + RandomString(50));
  36. logItem.PushBack("method", "SenderToServer " + RandomString(10));
  37. tmpLogGroup.add(logItem);
  38. logGroups.add(tmpLogGroup);
  39. }
  40. // 并发调用send发送日志
  41. Thread[] threads = new Thread[ThreadsCount];
  42. for (int i = 0; i < ThreadsCount; ++i) {
  43. threads[i] = new Thread(null, new Runnable() {
  44. Random random = new Random();
  45. public void run() {
  46. int j = 0, rand = random.nextInt(99999);
  47. while (++j < Integer.MAX_VALUE) {
  48. producer.send("project 1", "logstore 1", "topic",
  49. "source ip", logGroups.get(rand),
  50. new CallbackSample("project 1", "logstore 1", "topic", "source ip", null, logGroups.get(rand), producer));
  51. }
  52. }
  53. }, i + "");
  54. threads[i].start();
  55. }
  56. //等待发送线程退出
  57. Thread.sleep(1 * 60 * 60 * 1000);
  58. //主动刷新缓存起来的还没有被发送的日志
  59. producer.flush();
  60. //关闭后台io线程,close会将调用时刻内存中缓存的数据发送出去
  61. producer.close();
  62. }
  63. }

callback:

  1. public class CallbackSample extends ILogCallback {
  2. //保存要发送的数据,当时发生异常时,进行重试
  3. public String project;
  4. public String logstore;
  5. public String topic;
  6. public String shardHash;
  7. public String source;
  8. public Vector<LogItem> items;
  9. public LogProducer producer;
  10. public int retryTimes = 0;
  11. public CallbackSample(String project, String logstore, String topic,
  12. String shardHash, String source, Vector<LogItem> items, LogProducer producer) {
  13. super();
  14. this.project = project;
  15. this.logstore = logstore;
  16. this.topic = topic;
  17. this.shardHash = shardHash;
  18. this.source = source;
  19. this.items = items;
  20. this.producer = producer;
  21. }
  22. public void onCompletion(PutLogsResponse response, LogException e) {
  23. if (e != null) {
  24. // 打印异常
  25. System.out.println(e.GetErrorCode() + ", " + e.GetErrorMessage() + ", " + e.GetRequestId());
  26. //最多重试三次
  27. if(retryTimes++ < 3)
  28. {
  29. producer.send(project, logstore, topic, source, shardHash, items, this);
  30. }
  31. }
  32. else{
  33. System.out.println("send success, request id: " + response.GetRequestId());
  34. }
  35. }
  36. }

最后更新:2016-12-14 20:33:55

  上一篇:go log4j-appender__loghub-采集_用户指南_日志服务-阿里云
  下一篇:go syslog__loghub-采集_用户指南_日志服务-阿里云