互联网招聘信息数据说明
========================

数据来源：模拟智联招聘平台IT行业招聘数据
数据规模：20000条记录
生成时间：2025年

字段说明：
1. job_id: 岗位唯一标识符（格式：JOBXXXXXX）
2. job_name: 岗位名称（如：Java开发工程师、前端开发工程师等）
3. category: 岗位类别（后端开发、前端开发、移动开发、数据开发、人工智能、测试开发、运维开发、架构设计、项目管理、安全开发）
4. company_name: 公司名称
5. company_size: 公司规模（0-20人、20-99人、100-499人、500-999人、1000-9999人、10000人以上）
6. company_type: 公司性质（民营公司、外资企业、合资企业、国有企业、上市公司、创业公司）
7. industry: 行业领域（互联网/电子商务、计算机软件、IT服务/系统集成等）
8. city: 工作城市（北京市、上海市、深圳市、广州市、杭州市、成都市等15个城市）
9. district: 工作区域
10. salary_range: 薪资范围（格式：10-20K）
11. education: 学历要求（大专、本科、硕士、博士、不限）
12. experience: 工作经验要求（不限、1年以下、1-3年、3-5年、5-10年、10年以上）
13. tech_stack: 技术栈要求
14. welfare: 福利待遇
15. job_description: 岗位描述
16. publish_date: 发布日期
17. recruiting_count: 招聘人数
18. company_rating: 公司评分
19. avg_salary: 平均薪资（数值型，由salary_range计算得出）

数据分布特点：
- 城市分布：一线城市（北京、上海、深圳、广州）占比约58%，新一线城市（杭州、成都、南京等）占比约35%
- 岗位类别：10大类IT岗位均匀分布，每类约2000条记录
- 学历要求：本科需求占60%，硕士占20%，大专占15%
- 工作经验：1-3年和3-5年经验需求最高，各占30%
- 薪资水平：综合考虑城市、学历、经验和岗位类别等因素生成

数据用途：
1. 招聘城市分布热力图分析
2. 薪资水平与学历、工作经验的多元回归分析
3. 热门技术栈词云分析
4. 可视化系统展示
