V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
axin2023
V2EX  ›  云计算

一人说一个 it 运维的面试题,顺便测试下自己的水平~~

  •  
  •   axin2023 · 219 天前 · 13380 次点击
    这是一个创建于 219 天前的主题,其中的信息可能已经有所发展或是发生改变。
    107 条回复    2024-04-20 20:05:32 +08:00
    1  2  
    joy33
        1
    joy33  
       219 天前   ❤️ 10
    自我介绍下
    Part2
        2
    Part2  
       219 天前
    上家离职原因
    lixiaobai913
        3
    lixiaobai913  
       219 天前
    你对未来的规划
    geekvcn
        4
    geekvcn  
       219 天前   ❤️ 47
    能睡机房吗?
    dassh
        5
    dassh  
       219 天前   ❤️ 3
    你觉得自己有什么缺点
    lplplp
        6
    lplplp  
       219 天前
    你对薪资这块有什么想法
    ScotGu
        7
    ScotGu  
       219 天前
    为什么选择我们公司
    axin2023
        8
    axin2023  
    OP
       219 天前
    @joy33
    @Part2
    @lixiaobai913
    @geekvcn
    @dassh 本意是想大家集思广益整理下现在主流的面试题的,没想到你们直接来真的啊,哈哈哈哈
    kalista
        9
    kalista  
       219 天前
    能手搓 k8s 吗
    8355
        10
    8355  
       219 天前   ❤️ 4
    如何看待 24 小时 on call 的职业特性,你能做到吗
    test817
        11
    test817  
       219 天前   ❤️ 1
    哈哈哈,上面的回答也没毛病,谁家都会问 100%!
    我说一个,如果查找当前目录下文件中指定日期的 log (当前路径类似/var/xxx/log/*.log )
    gtese
        12
    gtese  
       219 天前
    什么时候能到岗?
    dongisking
        13
    dongisking  
       219 天前
    你凭什么要 15K ,我们招聘是 10-12K
    sunziren
        14
    sunziren  
       219 天前   ❤️ 2
    你这两个月的空窗期是什么情况?
    joy33
        15
    joy33  
       219 天前   ❤️ 1
    @test817 #11 百度
    0312birdzhang
        16
    0312birdzhang  
       219 天前
    会装 windows 吗?
    gwy15
        17
    gwy15  
       219 天前
    你造成的最大事故是什么?
    yolee599
        18
    yolee599  
       219 天前
    说说你的优缺点?
    seers
        19
    seers  
       219 天前 via Android   ❤️ 3
    我正好有一份线上事故的日志打包,NGINX ,MySQL ,java dump ,我会让他现场分析下原因,当然不用太详细,说出个思路就行
    ChangeTheWorld
        20
    ChangeTheWorld  
       219 天前
    能 007 待命么?
    liuzimin
        21
    liuzimin  
       219 天前
    @joy33 哈哈,这种命令我现在都是直接 chatGPT
    SherlockKevin
        23
    SherlockKevin  
       219 天前   ❤️ 1
    嘿嘿,曾经面试的时候活跃气氛用的:Windows server 默认用户名是什么?
    TrigVon
        24
    TrigVon  
       219 天前
    能出差么
    xuxuxu123
        25
    xuxuxu123  
       219 天前
    能接受加班以及 7*24 小时待命吗
    0312birdzhang
        26
    0312birdzhang  
       219 天前
    @SherlockKevin Administrator
    x86
        27
    x86  
       219 天前
    请问改服务器遇到了什么故障
    VVVYGD
        28
    VVVYGD  
       219 天前   ❤️ 5
    徒手摸网线 1s 能监听到多少个 ip 包
    corcre
        29
    corcre  
       219 天前
    @SherlockKevin 说起来这个, 我就想起来我司电脑莫名重启然后后台一看多出来一个叫"Windows"的用户在操作, 给我们吓傻了...
    somebody1
        30
    somebody1  
       219 天前   ❤️ 7
    @x86
    该四人明显是运维人员,他们在服务器的见证下桃园结义,称为机房结义。其中右二为老大,因为他有着强者的发型,左二为老二,因为他在老大的旁边且在内侧。其中最左侧为老三,最右侧为老四。

    此四人与工作中相识,却将感情延申到工作之外,这份情谊,天地可鉴,服务器可鉴,令人感动。

    这是属于运维工程师的高光时刻!!!
    axin2023
        31
    axin2023  
    OP
       219 天前
    @somebody1 出书吧,这个项目我投了...
    alexsz
        32
    alexsz  
       219 天前   ❤️ 2
    20 多年前第一份工作是深圳关外一家港资玩具厂,面试的关键环节是“打条线” ---- 现场做一条 T568B 的网线😁
    mightybruce
        33
    mightybruce  
       219 天前   ❤️ 4
    看看都在发搞笑的
    给几个稍微有点挑战的问题
    如何在 Linux 中恢复仍在活动进程中的已删除文件
    更难一点
    Linux 磁盘数据恢复:rm -rf 误删数据,如何进行数据恢复
    如何线上迁移 mysql 数据库并保证尽量不影响业务
    手动实现容器机制对进程隔离和资源限制
    大量 Timewait 的产生时如何处理、

    k8s 的运维问题可以问得非常多,不过我这里给的是一些通用运维问题。
    其实可以让 chatgpt 给你生成一堆面试题,你自己想想,然后解答。
    dlmy
        34
    dlmy  
       219 天前
    你对于我们公司了解多少?你能为我们公司带来什么呢?

    如果通过这次面试我们录用了你,但工作一段时间却发现你根本不适合这个职位,你怎么办?

    如果你的工作出现失误,给本公司造成经济损失,你认为该怎么办?
    nookd
        35
    nookd  
       219 天前
    @mightybruce 遇到了一个同类问题,Linux 磁盘空间释放:数据被删除后,仍被进程占用,如何进行空间释放(被标记为 delete 的文件太多了(大多是是 kafka 跟 mysql 干的),也筛不过来,只能准备重启服务器了)
    shuax
        36
    shuax  
       219 天前
    磁盘满了,怎么清理文件。
    bzw875
        37
    bzw875  
       219 天前
    说说为什么来应聘我们的公司?
    peakCa
        38
    peakCa  
       219 天前
    @shuax 拿扫把扫,倒垃圾桶里
    axin2023
        39
    axin2023  
    OP
       219 天前
    @nookd 占用文件对应进程重启就行了
    potatowish
        40
    potatowish  
       219 天前 via iPhone
    如果从来没出过运维问题,boss 认为你很闲,你怎么办
    Light3
        41
    Light3  
       219 天前
    你会接光纤吗 ?
    fine886
        42
    fine886  
       219 天前
    @mightybruce 咋处理啊,哥
    fine886
        43
    fine886  
       219 天前
    @mightybruce 真想知道
    somebody1
        44
    somebody1  
       219 天前
    @axin2023 #31
    明天星期四,先 v50 让我吃个肯德基整理整理思路😏
    lujiaxing
        45
    lujiaxing  
       219 天前
    @shuax ``sudo rm -rf --force --no-preserve-root / && sudo reboot``
    timeisweapon
        46
    timeisweapon  
       219 天前
    @potatowish #40 如果从来没失过火,是否可以不用买灭火器
    hefish
        47
    hefish  
       219 天前
    服务器电源按钮是什么形状的。
    Panameragt
        48
    Panameragt  
       219 天前
    接受 24 小时手机待命吗?
    8355
        49
    8355  
       219 天前
    @x86 安装的时候没开光,事后补救已无用。
    8355
        50
    8355  
       219 天前
    @shuax 有陷阱兄弟们,不能清理文件,正确答案是扩容。
    deorth
        51
    deorth  
       219 天前 via Android
    微内核
    lujiaxing
        52
    lujiaxing  
       219 天前   ❤️ 1
    1. 给新同事装 Windows 需要怎么装? 公司大厦上万人, 每天都会有不同分/子公司或不同部门的新员工入职老员工离职, 怎么以最快的速度为各新员工准备好工作电脑以及其中工作的软件环境? 是直接拉 ISO 镜像一个一个来装么? 还是用什么其他方式?
    2. Active Directory 域怎么搭建?
    3. OSI 七层模型
    4. 请设计整栋办公楼的办公网络拓扑模型, 整栋楼使用一个 SSID 为公司员工提供 WIFI. 一个 SSID 用于访客网络. 公司办公网络接入电信与联通双线.
    5. 你用过什么硬件防火墙?
    wenxueywx
        53
    wenxueywx  
       219 天前
    使用 awk 计算指定目录下当天的所有日志文件总和
    0bing
        54
    0bing  
       219 天前
    @mightybruce 来挑战一下
    1. 在进程目录/proc 里应该会有锁定的文件
    2. rm -rf G....Recuva 试过,拿不出来全部的,文本类型的还行。
    3. 给他整个主从数据库?
    4 和 5.超纲
    hornets
        55
    hornets  
       219 天前
    @fine886 1 、从/proc/<PID>/ 里面找
    2 、不要进行读写,磁盘恢复
    3 、全量备份恢复+增量同步,然后切换
    4 、命名空间
    5 、Timewait 重用+缩短时间
    mulu
        56
    mulu  
       219 天前 via Android
    接受节假日值班吗?
    a771507192
        57
    a771507192  
       219 天前   ❤️ 1
    你结婚了吗
    1018ji
        58
    1018ji  
       219 天前
    怎样不知不觉顺一块硬盘
    0bing
        59
    0bing  
       219 天前
    @lujiaxing
    这是 IT 桌面的范畴,我来个加难的
    AD 域从 03 环境升级到 20 ,怎么做是最佳实践
    在没有环路警告的交换网络中,怎么样查出环路的地方
    在信号好的情况下,两个 ssid ,一个用静态 PSK 认证,另外一个 802.1x 验证,但是获得的连接速度差很远,请问可能是因为什么原因。
    ropon
        60
    ropon  
       219 天前   ❤️ 5
    1 、都说 linux 下一切皆文件,你是怎么理解的?
    2 、都说 socket 在 linux 实际是一个文件,是通过什么技术将 socket 变成一个文件的?
    3 、linux 下软 /硬连接是什么,他们有什么区别?
    4 、linux 下一个用户登录以下文件加载顺序是?~/.bash_profile, ~/.bash_login, ~/.profile, ~/.bashrc, /etc/profile
    6 、shell 相关 [[]] [] (()) () 他们区别是?
    7 、shell fuction 如何返回字符串
    8 、shell $# $* 是什么意思
    9 、如何使用 shell 实现一个爬虫,你描述下整个过程,会用到哪些命令?
    12 、0.0.0.0 255.255.255.255 这 2 个 ip 地址是什么意思?他们的适用场景是?
    Arumoh
        61
    Arumoh  
       219 天前
    你有删库到跑路的历程吗?
    libook
        62
    libook  
       219 天前
    load average 具体表现的是什么指标?
    内存指标的 buff/cache 代表什么?
    RAID 主要是用来保障数据的: A. 完整性 B. 可用性 C. 保密性
    阐述 Linux 的 ACL 是什么。
    chenxiansheng
        63
    chenxiansheng  
       219 天前
    你们看着好叼啊,感觉我一个都不会,现在只会问 AI 和度娘了...
    nailong2
        64
    nailong2  
       219 天前
    交换机与服务器如何做链路聚合?
    堆叠和 m-lag 的区别以及使用场景?
    BGP 的选路?
    madowenzy
        65
    madowenzy  
       219 天前
    @lujiaxing #52 对 helpdesk 来说都算问的深的程度,第一个问题真不知道什么是最优解
    madowenzy
        66
    madowenzy  
       219 天前
    @lujiaxing #52 说实话第一个我第一反应是 PXE 网启安装,不知道对不对
    knva
        67
    knva  
       219 天前
    说个最常见的,有人私插了个路由器,全都上不了网了,怎么处理
    nailong2
        68
    nailong2  
       219 天前
    @knva 交换机上启用 DHCP snooping ,接入启用端口隔离,端口安全限制 mac 学习数量
    jimmyczm
        69
    jimmyczm  
       219 天前
    用户要求发生关系否则差评,这种情况如何处理
    defunct9
        70
    defunct9  
       219 天前
    完犊子了,一道题也不会
    dog82
        71
    dog82  
       219 天前
    我一般会问,在工作工程中,遇到过什么很难解决的问题,是怎么解决的
    proxychains
        72
    proxychains  
       219 天前
    @x86 #27 左一大哥还有拔罐, 令人感叹
    tudou1514
        73
    tudou1514  
       219 天前
    @dassh 我的缺点就是优点太多 狗头
    proxychains
        74
    proxychains  
       219 天前
    @jimmyczm #69 打车过去发生关系
    yKXSkKoR8I1RcxaS
        75
    yKXSkKoR8I1RcxaS  
       219 天前   ❤️ 2
    会搞分布式吗?
    谈谈你的灾备方案?
    谈谈你的无感迁移方案?
    做过百万级流量运维架构吗?
    谈谈你对运维大数据的理解?

    入职后...

    “网管,修下电脑”
    “网管,给新同事搬台电脑”
    “网管,修下网络”
    “网管,没网了”
    “网管,C 盘满了”
    “网管,打印机坏了”
    “网管,装下系统”
    “网管,垃圾倒一下”
    ...
    Z1076
        76
    Z1076  
       219 天前
    怎么避免 rm -rf /*
    axin2023
        77
    axin2023  
    OP
       219 天前
    @Seria 真实写照...
    xderam
        78
    xderam  
       219 天前
    IT 运维的定义是啥?纯 IT 的话没要求那么多 能修电脑就可以了。运维加上一个修服务器完活~~
    encro
        79
    encro  
       219 天前
    某个进程占用内存和 cpu 很高,如何知道它在干啥?
    fitme
        80
    fitme  
       219 天前   ❤️ 1
    告警泛滥如何解决?
    PaulSamuelson
        81
    PaulSamuelson  
       219 天前
    如果你在线上的数据库服务器上,不小心执行了 rm -rf / , 你会如何应对?
    emma3
        82
    emma3  
       219 天前
    linux 能玩 QQ 斗地主吗?
    Ackvincent
        83
    Ackvincent  
       219 天前
    在 Linux 分析性能瓶颈的基本方法是什么?
    simo
        84
    simo  
       219 天前
    根据以往经验,介绍下不同软硬件适合供奉哪尊神
    zhoudaiyu
        85
    zhoudaiyu  
       219 天前
    客户端发起一个请求到应用服务器,需要访问下游的数据库,客户端响应时间变长,如何定位是服务端本身的问题,还是数据库的问题
    otakustay
        86
    otakustay  
       219 天前
    N 个容器下的日志汇聚到一处统一查询,使用什么方案
    solopython
        87
    solopython  
       219 天前
    开下无犯罪记录
    Joming
        88
    Joming  
       219 天前
    @Seria 这是大部分的现实。
    justjy
        89
    justjy  
       219 天前
    OP 应该先把 JD 发下 楼上各种 Windows 管理员、Linux 管理员、网络管理员的问题
    niushuai
        90
    niushuai  
       219 天前
    @geekvcn 哈哈
    freshmanc
        91
    freshmanc  
       219 天前
    @encro 这咋看。。strace 一把?
    giffgaffman
        92
    giffgaffman  
       219 天前
    有点蚌埠住,你们呢?
    majula
        93
    majula  
       219 天前
    当执行一个命令时,Bash 搜索命令名的顺序是什么?(假设命令名不以“/”开头)
    A. $PATH
    B. alias
    C. shell builtin
    D. shell function
    SD10
        94
    SD10  
       219 天前 via iPhone
    符合看待你过去的公司和老板
    SD10
        95
    SD10  
       219 天前 via iPhone
    @SD10 *如何
    mightybruce
        96
    mightybruce  
       219 天前
    @0bing
    文件删除的两种情况
    第 1 种是在执行 rm -rf 删除文件时,该文件正在被进程使用。第 2 种是这个文件并没有被其他进程所使用,而被误删除。
    首先找到该进程的 pid
    进入/proc/{pid}/fd 找到相关正在使用被删除的文件
    cp 相关序列号 新文件名

    没有进程使用,被误删的情况
    需要一个工具 extundelete
    如果目录是挂载在对应的磁盘分区, 目录下的文件和文件夹都删除了,
    先 unmout ,防止其他进程写入
    找到相应 inode 数字, 然后用 extundelete 恢复

    mysql 线上迁移 使用 online ddl 要有一个主库 一个从库
    配合下面两个工具
    pt-online-schema-change
    gh-ost
    使用

    容器手动敲命令使用 namespace 和 cgroup 的方式我就不写了

    timewait 一般都是应用程序导致的,下面这些属于救急
    方法 1 将 timewait 队列加大 tcp_max_tw_buckets
    方法 2 将 timewait 超出时间做修改,tcp_fin_timeout 调到合理范围
    ryd994
        97
    ryd994  
       219 天前 via Android
    @madowenzy 企业装系统:
    不一定适合别的公司,我就说说我司是怎么做的:电脑买预装 Windows enterprise 。OOBE 登入 AAD 账号,登入后 AAD 会下发配置,包括系统设置和强制安装的软件。

    高安全环境可以出厂就预装指定系统和软件,BIOS 锁死。只能以普通用户权限登入。用户无法自行重装系统,只能由 IT 部门控制重装(可远程控制)。这种深度定制基本上只有大厂采购才行了。

    非 IT 公司的 helpdesk 我也干过。做法就简单多了:ghost 梭哈…… 制作镜像前用 sysprep 删除用户信息,开机后会再次 oobe 。
    oldboy627
        98
    oldboy627  
       218 天前
    一、写一个定时执行的 Bash 脚本,每月的一号凌晨 1 点 对 MongoDB 中 test.user_logs 表进行备份、清理

    首先备份上个月的数据,备份完成后打包成.gz 文件
    备份文件通过 sfpt 传输到 Backup [[email protected]] 服务器上,账户已经配置在~/.ssh/config;
    备份完成后,再对备份过的数据进行清理: create_on [2024-01-01 03:33:11] ;
    如果脚本执行失败或者异常,则调用 [https://monitor.ipo.com/webhook/mongodb ];
    这个表每日数据量大约在 200w 条, 单条数据未压缩的存储大小约 200B;


    二、已知生产环境数据库结构如图所示,因为 master 服务器偶尔有硬件问题,需要先将 slave_01 提升为新 master, 然后旧 master 变成 slave_01 。请给出操作方案和关键命令。

    主从数据库服务均处于独立服务器上,有独立的 IP;
    应用程序写入数据库通过域名[mysql-master.ipo.com]访问;
    应用程序读取数据通过 Haproxy[mysql-slave.ipo.com]访问所有从库[01-04];
    尽量平滑处理,不影响生产环境;
    nuk
        99
    nuk  
       218 天前
    来,你脚旁边这台服务器,请把它抬桌子上
    lulinchuanllc
        100
    lulinchuanllc  
       218 天前
    你能给我们公司带来什么?
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   970 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 89ms · UTC 21:42 · PVG 05:42 · LAX 13:42 · JFK 16:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.