- docker课程中,老师是用tomcat镜像来演示docker的一些操作
- 但同样的操作有的同学是ok的,有的同学就会遇到如下错误
- 核心信息
exited(1) cannot find /usr/local/tomcat/bin/setclasspath.sh this file is needed to run this program
- 一开始也挺费解的,我虽然不上这个课,但也比较好奇,自己始终无法复现,但不断有学员问,我看到就回复,在docker run命令后加一个--privileged即可
- 但为何呢,不能说的很清楚,因为--privileged这个参数就是让你容器内的root用户具备拥有真正的root权限。否则容器内的root只是外部的一个普通用户权限。
- 从上面的提示可以看到容器退出了,exitcode是1
- 1的意思是:
- 程序错误,或者dockerfile中引用不存在的文件,如 entrypoint中引用了错误的包
- 程序错误可以很简单,例如“除以0”,也可以很复杂,比如空引用或者其他程序 crash
- exitcode1: indicates failure due to application error
- indicates that the container stopped due to either an application error or an incorrect reference in dockerfile to a file that is not present in the container.
- an application error can be as simple as “divide by 0” or as complex as “reference to a bean name that conflicts with existing, non-compatible bean definition of same name and class.”
- an incorrect reference in dockerfile to a file not present in the container can be as simple as a typo (the example below has
instead ofsample.jar
- 知道了这个似乎帮助不大,不过有的容器退出码是非常能指向原因的,比如exitcode 0
- 这个线索就非常重要了
- 那为何会无法找到,真的有吗?有的
- 比如在我这个正常的容器中
[root@hecs-67651 ~]# docker ps -a container id image command created status ports names 59463bed0fd7 tomcat "catalina.sh run" 35 minutes ago up 35 minutes 8080/tcp mytomcat5 [root@hecs-67651 ~]# docker exec -it 594 ls /usr/local/tomcat/bin/setclasspath.sh /usr/local/tomcat/bin/setclasspath.sh
- 那遇到问题的学员为何找不到呢?
- 我们的这个tomcat镜像在启动的时候会执行一个脚本
[root@hecs-67651 ~]# docker inspect -f '{{.config.cmd}}' tomcat:latest [catalina.sh run]
- 来看看catalina.sh做了啥
- 这个shell脚本比较大646行,我就摘录关键部分
- 你看懂需要懂一些shell
- 第一部分:报错在哪里
if $os400; then # -r will only work on the os400 if the files are: # 1. owned by the user # 2. owned by the primary group of the user # this will not work if the user belongs in secondary groups . "$catalina_home"/bin/setclasspath.sh else if [ -r "$catalina_home"/bin/setclasspath.sh ]; then . "$catalina_home"/bin/setclasspath.sh else echo "cannot find $catalina_home/bin/setclasspath.sh" echo "this file is needed to run this program" exit 1 fi fi
- 可以看到我们的报错就在这里
- 执行的时候[ -r "$catalina_home"/bin/setclasspath.sh ]这个分支为假就走到了我们的报错中,exit 1
- 这句话的意思是看 "$catalina_home"/bin/setclasspath.sh文件是否有read权限
root@59463bed0fd7:/usr/local/tomcat/bin# ll setclasspath.sh -rwxr-xr-x 1 root root 3342 mar 6 23:33 setclasspath.sh*
- 在我这个ok的环境中的权限如上,read是有的
- 那可能的问题就是在catalina_home这个变量是否存在
- 而再往前看我们走到第一个else是因为$os400为假
cygwin=false darwin=false os400=false hpux=false case "`uname`" in cygwin*) cygwin=true;; darwin*) darwin=true;; os400*) os400=true;; hp-ux*) hpux=true;; esac
- 从这里可以看到os400初始值为false,只有你的uname是os400的时候才为true
- 而我们这个环境的uname的值是
[root@59463bed0fd7 ~]# uname linux
- 第三部分:[ -r "$catalina_home"/bin/setclasspath.sh ]
- 等价于 test -r "$catalina_home"/bin/setclasspath.sh
- 我这个ok的环境执行效果
root@59463bed0fd7:/usr/local/tomcat/bin# [ -r "$catalina_home"/bin/setclasspath.sh ] root@59463bed0fd7:/usr/local/tomcat/bin# echo $? 0
- 可以看到,是为0的返回值,那自然就不会报错,报错的环境肯定是非0 的
- 问题的焦点似乎就集中到了$catalina_home上
# 下面的意思是如果没有catalina_home这个变量就设置为cd "$prgdir/.." >/dev/null; pwd 这个pwd的结果 [ -z "$catalina_home" ] && catalina_home=`cd "$prgdir/.." >/dev/null; pwd` # 而prgdir是这么来的 prgdir=`dirname "$prg"` # prg来自 prg="$0" # 就是catalina.sh所在目录 # 下面的我也有点看不懂了,大致就是获取目录 while [ -h "$prg" ]; do ls=`ls -ld "$prg"` link=`expr "$ls" : '.*-> \(.*\)$'` if expr "$link" : '/.*' > /dev/null; then prg="$link" else prg=`dirname "$prg"`/"$link" fi done
- 找了半天找了个寂寞?好像是的。那问题到底在哪里呢?我也没法复现。捋一捋
- 线索:[ -r "$catalina_home"/bin/setclasspath.sh ] 执行为非0是肯定的
- 如果文件存在,变量存在,那问题就只能是-r了,权限问题!
- 在docker run命令后加一个--privileged即可
- --privileged这个参数就是让你容器内的root用户具备拥有真正的root权限。否则容器内的root只是外部的一个普通用户权限。
- 往上有个文档说是:与faccessat2系统调用有关,由于 runc 中的 bug,如果您的内核不支持 faccessat2,它将失败。这有点难了~看不懂