Ldyer

晚明初清江南的基层诉讼机制还挺有意思的。

塑造性格的记忆，本身已被性格选择过千万次。

最近和一些人谈到了感情问题。身为一个母单，对象一定要是一个母单，毕竟总感觉，如果我兴致勃勃和对象第一次逛街，第一次看电影，第一次散步，第一次旅行时，万一对方已经早就和上一任对象经历过了这些，那么感觉一切都已经索然无味，感情中的“宿命感” 荡然无存了。就好像当你满怀期待邀请朋友一起看你最推荐的电影时，他却告诉你已经看过了，或者中途自顾自玩手机，这也太扫兴了。虽然这种符号化情绪很变扭，但是宁缺毋滥，遇不到就说明没缘分，一直单着也挺好的～

服了，居然没有人开发一款免费的Hbase的可视化客户端，每次查数据太麻烦了！

秋天来啦，丸辣，又要桂花过敏了！

大四咯，大学要结束了。

噗，没动力了~

天天困得要死

真羡慕他们几个搞项目的。。

最近怎么越来越发油了，天天早上起来洗头洗脸，到了中午就油了，令人感叹。

公告

置顶|发表于2023-10-06|更新于2024-11-04| 条评论

欢迎来到Ldyer的个人博客,这个网站记录了我的知识经验、生活分享以及日常吐槽，如有什么问题，请评论区留言哟~ 网页输入blog.ldyer.top即可访问。手机端使用方式手机端点击右上角可以打开博客菜单文章右侧可以选择夜间模式与目录(现在夜间模式已删除) 评论方式如果你想留言，那么直接在页面下输入你的邮箱就可回复，如果你想匿名回复，请再邮箱处直接输入"1@qq.com"即可。

“协和4+4”事件的舆情数据采集与可视化

发表于2025-05-04|更新于2025-05-14| 条评论

1. 事件起因关于协和医学院“4+4”培养模式与争议的总结（由DeepSeek-R1生成） 1.1 事件背景 “4+4”培养模式：北京协和医学院于2018年启动“临床医学专业培养模式改革试点班”（简称“4+4”），旨在通过“4年非医学本科教育+4年医学教育”培养多学科背景的医学人才。该模式模仿美国医学教育体系，但国内选拔标准模糊，引发争议。董袭莹事件：当事人董袭莹本科就读哥伦比亚大学巴纳德学院经济学专业，通过“4+4”项目进入协和医学院，仅用4年完成医学博士学业，并快速晋升为中日友好医院胸外科医生。其跨专业背景、论文篇幅过短（仅30页）、临床能力不足（如心电图误判率23%）等问题被曝光，且家庭背景与院士导师邱贵兴的潜在关联引发特权质疑。 1.2 争议焦点选拔机制不透明： “4+4”要求报考者来自“国内外顶尖高校”，但实际操作中被质疑为特权通道。例如，董袭莹的本科院校巴纳德学院QS排名未达协和招生简章标准，部分学生通过海外“野鸡大学”学历绕过国内高考竞争。传统医学生需经历高考、硕士/博士考试及规培，而“4+4”学生通过推荐制入学，缺乏公开考试和公平竞争。培养 ...

微博评论爬取

发表于2025-04-10|更新于2025-04-11| 条评论

1. 项目简介✍🏻 本项目👀是基于Python开发的微博评论采集工具，支持深度获取微博评论数据及多维用户画像。通过逆向解析微博URL参数，实现短链到博文ID的精准转换，采用递归算法抓取多级嵌套评论（含二级回复）。系统整合微博开放接口，可提取30+用户属性，涵盖基础信息（性别👩、年龄、星座⛎️）、社交行为（粉丝量、互动量）、认证状态（黄V/企业认证）、信用等级、IP属地及教育职业背景🎓 等维度。数据以结构化CSV格式存储，包含评论内容、点赞数、用户粉丝等级等字段，适用于舆情分析、用户行为研究等场景。通过Cookie认证机制保障请求合法性，内置0.5秒/次的请求间隔防止反爬，为社交媒体数据挖掘提供高效合规的解决方案。 🐨Github项目地址：weibo-comment-crawler 🐒CSDN项目地址：基于Request爬取微博所有评论（一二级评论、楼中楼）和用户信息（IP地址、简介、粉丝牌、微博认证、年龄、星座、学历、公司、注册日期、点赞、关注、评论、转发数等）附带源码与教程 🐼个人博客教程地址：基于Request的微博评论爬取教程相关爬虫🦊：B站评论爬取(I ...

B站评论爬取(IP地址、内容、大会员、性别等等)教程

发表于2025-03-26|更新于2025-05-30| 条评论

前言🐈 用于爬取Bilibili（B站）视频评论的爬虫，支持爬取一级评论及二级回复，并将数据导出为CSV文件。通过输入视频的BV号，脚本会自动获取视频信息并抓取相关评论，包含用户基本信息、评论内容、IP属地、头像、会员、等级等字段。🦄🦄 🐨Github项目地址：bilibili-comment-crawler 🐒CSDN项目地址：利用Request通过bv号爬取B站指定视频下所有评论（IP地址、大会员、等级、一二级评论等等)，附带源码和教程 🐼博客教程地址：B站评论爬取(IP地址、内容、大会员、性别等等)教程 1. 数据样例🤪 2. 功能特性多级评论爬取：支持爬取一级评论及二级回复。用户信息采集：包括用户ID、用户名、等级、性别、IP属地、大会员状态等。自动分页处理：自动遍历所有评论页，无需手动分页。反爬机制处理：使用时间戳和MD5加密生成请求参数，降低被封禁风险。数据导出：结果保存为CSV文件，兼容Excel和数据分析工具。 3. 快速开始步骤1：配置Cookie 登录B站，然后按F12打开开发者模式,点击网络，在搜索框中搜索Co ...

Flink学习笔记

发表于2025-02-20|更新于2025-03-02| 条评论

一、Flink的安装与配置 1.1 Flink的下载到清华镜像源选择合适的版本进入目录 1cd ~/software 下载 1wget https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.17.2/flink-1.17.2-bin-scala_2.12.tgz 解压 1tar -zxvf flink-1.17.2-bin-scala_2.12.tgz 二、Flink的集群配置 2.1 flink-conf.yaml文件配置打开Flink/conf/flink-conf.yaml文件 1vim ~/software/flink-1.17.2/conf/flink-conf.yaml 配置以下内容 12345678910111213141516171819202122232425jobmanager: bind-host: 0.0.0.0 rpc: address: Node01 port: 6123 memory: process: size: 1600m execut ...

实现微博话题趋势查询接口

发表于2025-01-24|更新于2025-01-24| 条评论

Node.js 实现微博话题趋势查询接口教程简介本教程介绍如何使用 Node.js 搭建一个简单的 HTTP 服务，基于 Express 和 Axios 提供一个可以查询微博话题趋势的接口。用户可以通过 GET 请求指定关键词（search）和时间范围（time）获取相关数据。功能概述技术栈：Express.js（搭建服务器）、Axios（发起 HTTP 请求）核心功能：实现一个 GET 接口 /search，通过 search 参数指定查询话题，通过 time 参数控制时间范围（如 1小时、1天、7天、30天）。 API 源地址：接口将数据请求重定向到微博的 AJAX 接口 https://m.s.weibo.com/ajax_topic/trend。代码结构导入模块 12const express = require('express'); // Express.js 用于搭建 Web 服务器const axios = require('axios'); // Axios 用于发起 HTTP 请求配置服务器 1. ...

Hbase学习笔记

发表于2024-12-29|更新于2025-03-03| 条评论

一、HBase 简介 HBase 是一个分布式、可扩展的列式存储数据库，基于 Google 的 Bigtable 设计构建。它是 Hadoop 生态系统的一部分，主要用于处理海量的结构化数据。与传统的关系型数据库不同，HBase 采用列存储而不是行存储，这使得它非常适合处理大量的稀疏数据，并且支持快速随机访问。 1.1 HBase 的特点：分布式架构：HBase 运行在集群模式下，数据被分布在多个节点上，实现了高可用性和容错能力。横向扩展性：可以根据需求增加节点，扩展存储和计算能力。列式存储：数据按照列而非行进行存储，这对某些特定应用（如大规模分析、实时数据访问）非常有利。高并发写入：适合高吞吐量的数据写入和实时数据处理。无模式（Schema-less）：在 HBase 中，不同的行可以有不同的列，可以灵活地存储结构化或半结构化数据。 1.2 HBase 的用途：大数据存储：当需要存储大量的数据并能够进行高效的快速查询时，HBase 是理想的选择。例如，可以用于存储日志数据、传感器数据、社交媒体数据等。实时数据分析：HBase 支持快速的随机读写，适合需要实时分析的 ...