面试算法题(shell/日志数据查询统计)

1，写一个shell脚本，实现mysql日志关键字查询，日志基于时间存放在不同的压缩包中

#!/bin/bash

# 设置 MySQL 日志文件夹路径
log_folder="/path/to/mysql/logs"

# 设置关键字
keyword="your_keyword_here"

# 遍历日志文件夹下的所有压缩包
for logfile in "$log_folder"/*.gz; do
    # 解压缩日志文件
    gunzip -c "$logfile" > /tmp/unzipped_log.log

    # 在解压后的文件中查找关键字
    if grep -q "$keyword" /tmp/unzipped_log.log; then
        echo "关键字 '$keyword' 在文件 '$logfile' 中找到。"
        # 可以在此处添加更多处理逻辑，例如将匹配的行写入输出文件等
    fi

    # 删除临时解压文件
    rm /tmp/unzipped_log.log
done

2, 从9亿个数中找出中位数

import java.util.PriorityQueue;

public class FindMedian {

    public static double findMedian(int[] nums) {
        // 创建两个优先队列，一个最大堆和一个最小堆
        PriorityQueue<Integer> maxHeap = new PriorityQueue<>((a, b) -> b - a);
        PriorityQueue<Integer> minHeap = new PriorityQueue<>();

        for (int num : nums) {
            // 将元素插入最大堆，然后将最大堆中最大的元素移动到最小堆
            maxHeap.offer(num);
            minHeap.offer(maxHeap.poll());

            // 如果最小堆的大小超过最大堆，将最小堆中最小的元素移动到最大堆
            if (minHeap.size() > maxHeap.size()) {
                maxHeap.offer(minHeap.poll());
            }
        }

        // 如果数据量为奇数，中位数在最大堆的根元素
        if (maxHeap.size() > minHeap.size()) {
            return maxHeap.peek();
        } else { // 如果数据量为偶数，中位数为两个堆顶元素的平均值
            return (maxHeap.peek() + minHeap.peek()) / 2.0;
        }
    }

    public static void main(String[] args) {
        int[] nums = {3, 1, 4, 2, 5, 7, 6, 8};
        double median = findMedian(nums);
        System.out.println("中位数为: " + median);
    }
}

3,有10个文件，每个文件1G，每个文件的每一行都是用户的query，每个文件的query都可能重复，要求你按照query的频度排序。

import java.io.*;
import java.util.*;

public class QueryFrequencySorter {
    public static void main(String[] args) throws IOException {
        // 用于存储查询(query)及其频度的映射
        Map<String, Integer> queryFrequencyMap = new HashMap<>();

        // 读取所有文件
        for (int i = 1; i <= 10; i++) {
            String fileName = "file" + i + ".txt";
            BufferedReader reader = new BufferedReader(new FileReader(fileName));
            String line;
            
            while ((line = reader.readLine()) != null) {
                // 分割查询(query)，这里假设查询以空格分隔
                String[] queries = line.split(" ");
                
                // 遍历并更新查询(query)的频度
                for (String query : queries) {
                    queryFrequencyMap.put(query, queryFrequencyMap.getOrDefault(query, 0) + 1);
                }
            }
            
            reader.close();
        }

        // 将查询(query)按照频度降序排序
        List<Map.Entry<String, Integer>> sortedQueries = new ArrayList<>(queryFrequencyMap.entrySet());
        sortedQueries.sort((e1, e2) -> e2.getValue().compareTo(e1.getValue()));

        // 打印排序后的查询(query)
        for (Map.Entry<String, Integer> entry : sortedQueries) {
            System.out.println(entry.getKey() + ": " + entry.getValue());
        }
    }
}

面试算法题(shell/日志数据查询统计)

更多推荐

Java 21 新特性：Record Patterns

1. 两数之和

【python零基础入门学习】python进阶篇之时间表示方法和异常处理以及linux系统的os模块执行shell命令以及记账程序编写教学（一）

从统计语言模型到预训练语言模型---神经网络语言模型

Windows 下 MySQL 8.1 图形化界面安装、配置详解

Vulnhub系列靶机-Hackadmeic.RTB1

shell练习（grep，sed，awk，距离生日天数的计算，累加求和，文件操作和文本操作）

网络安全（黑客）自学

vue3+element-plus权限控制实现(el-tree父子级不关联情况处理)

【深度学习】树莓派Zero w深度学习模型Python推理

Redis 持久化之 RDB 与 AOF 详解

热文推荐

Elastic Stack 8.10：更简单的跨集群搜索和身份验证等等

演示spring AOP的切入表达式重用和优先级问题以及怎么实现基于xml的AOP

王江涛十天搞定考研词汇

【企业级SpringBoot单体项目模板】 —— 全局配置

XC3420B 低压降压IC 5V降3.3V 大电流降压IC 开关频率1.5MHZ

在月球上看地球和太阳是怎么转的？

三维模型3DTile格式轻量化在网络传输中的重要性分析

Swift 5.9 有哪些新特性（二）

2603. 收集树中金币