阅读350 返回首页    go 阿里云 go 技术社区[云栖]


调度运维常见问题__常见问题_大数据开发套件-阿里云

Q:工作流节点出错怎么看日志?

A:进入“运维中心-任务运维-运维”,过滤条件:输入任务名称、业务日期选“接到的节点实例出错提醒的业务日期”,查询,结果列表选中任务实例,右边DAG图里,鼠标对实例右键点击‘查看节点运行日志’。


Q:刚提交好了一个工作流,设置为周期调度,定时时间已经到了,怎么还不见跑起来?

A:当天新增成功的工作流/节点,且在当天23:30前提交/发布成功,需要第二天才会自动调度。当天可以通过手动测试或补数据调度。


Q:创建了周期调度工作流,且昨天就23:30前就发布成功了,今天运维中心里看还是没有自动调度起来。

A:以下几种原因都会导致工作流未调度,注意逐一排查:

1)工作流属性-调度属性-启动调度选项没有勾上。2)工作流虽然勾选‘启动调度’但是今天的日期不再设置的‘生效时间’范围内。3)工作流设置的定时调度时间没到。4)工作流设置有上游依赖,上游工作流未全部运行成功。


Q:工作流前段时间每天都正常调度,今天突然没有了,工作流实例都没生成。

A:请注意查看工作流是否已经删除,或者工作流属性的生效时间已经过了,若生效时间已过可以修改。

Q:数据同步任务等待资源时间过长,一直等待资源?

A:如果任务使用自定义资源组,那么:

  1. ECS上已经跑了太多的任务,导致任务排队;
  2. ECS节点无法正常工作,可以到 组织管理-》调度资源 -》 资源服务器 看下ECS资源是否正常,也可以考虑重启一下ECS上的agent,命令是:su - admin/home/admin/alisatasknode/target/alisatasknode/bin/serverctl restart

如果任务使用默认资源组,那么就是资源组并发已满,需要等待或者可以考虑使用自定义资源组。

Q:数据同步任务报错:获取作业配置信息失败:/home/admin/shell_datax/T3_0028378354 - File ‘/home/admin/shell_datax/T3_0028378354’ does not exist

A:这个错误一般是通过自定义资源组执行shell调datax的任务,可以在自定义机器上su - admin切换到admin账号后,执行下datax任务调试下,常见原因:

  • 权限问题(datax的任务是用admin账号执行的,如果用root配置了环境,可能有一些操作admin账号会没权限)
  • datax配置的时候就有问题,无法正常执行。

如果还是无法解决请提交工单寻求帮助!

Q:整个工作流中间的一个节点出错,能否跳过先执行其他的节点?

A:如果节点没运行成功,下游节点是不能正常运行。若节点之间业务逻辑没有依赖关系,则应该取消其直接的调度依赖;若仅仅是本次执行可以不依赖出错节点的执行结果,则可以对出错的节点实例操作右键“置成功并恢复调度”这样可以先跳过出错节点调度下游节点。

最后更新:2016-12-20 17:43:22

  上一篇:go 数据管理常见问题__常见问题_大数据开发套件-阿里云
  下一篇:go 权限相关常见问题__常见问题_大数据开发套件-阿里云