生成式人工智能大语言模型开发主要职责:1、在生成式人工智能项目中进行设计和开发工作,包括但不限于人工智能模型的开发、训练、优化和部署。2、基于GPT、LLaMA等开源基础AI模型开发出我们自己的垂直领域的专用的AI模型;收集、整理、清洗数据集,并用数据集训练我们的AI模型。3、能够处理结构化和非结构化数据,如文本数据、图像数据等,熟悉数据的格式转换,如CSV、JSON、XML等。了解和实践过特征工程的基本技巧,包括特征选择、特征转换和特征提取等。具有使用数据库(如SQL、NoSQL)进行数据查询和清洗的经验。4、处理大规模数据集和训练大型模型,熟悉数据预处理、特征工程、模型选择和超参数调优等步骤。5、使用自动化机器学习(AutoML)工具和框架进行模型选择和超参数优化。6、熟悉当前的模型训练*佳实践,能够识别过拟合、欠拟合等问题,并知道如何解决。对转移学习(TransferLearning)和少样本学习(Few-shotLearning)有一定的理解和实践经验。7、具备在多种硬件平台(如CPU、GPU、TPU等)上进行模型训练和优化的能力。任职要求:1、计算机相关专业以上,工作经验两年以上。2、理解并能够使用常见的人工智能框架,如TensorFlow、PyTorch等,进行模型的开发和优化。3、理解并掌握人工智能的基础概念,熟悉常用的机器学习和深度学习算法,理解其工作原理和适用场景,包括但不限于卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GANs)、强化学习等。4、掌握生成式人工智能的相关技术,包括大语言模型、图像生成模型、语音合成模型等,并能利用这些技术解决实际问题。有一定的NLP和Transformer的知识基础。5、了解大型语言模型(例如GPT、BERT、LLaMA等)的开发和优化工作原理,理解并能应用相关的技术和理论。6、熟悉开源项目和社区,能参与生成式人工智能开源项目的开发和维护工作,与全球的开发者社区进行交流和合作。7、对数据预处理和清洗有一定的了解,包括处理缺失数据、异常值、重复数据等问题。具有使用Python数据处理库(如Pandas,NumPy等)清洗和处理大规模数据集的知识和能力。8、具有使用数据库(如SQL、NoSQL)进行数据查询和清洗的经验。9、熟悉CentOS操作系统,具备在Linux环境下的项目开发和部署的能力。10、有Python、C++、GoLang或其他主要开发语言的实践经验。11、熟悉使用版本控制系统,如Git,以及持续集成/持续部署(CI/CD)工具。12、有使用Docker或其他容器技术进行模型部署的经验。13、了解常见的云平台,熟悉云环境下的项目部署知识和基本能力。14、了解开源项目的协议规则和部署方法(Github)。
联系我时,请说是在58同城上看到的,谢谢!