好的想法需要地方降落,否则它们只会飘走!

👋欢迎来到我的博客。在这里我会分享一些关于技术和生活的思考。

主流大语言模型全景指南:比较与实战选型

从2022年底ChatGPT发布以来,到现在短短三年时间,大语言模型(LLMs)迅速崛起,市面上各种大模型层出不穷, 国外的如Chatgpt(openai), Gemini(Google), Grok(XAI), Claude(Anthropic)等,国内的有DeepSeek,阿里的通义千问, 字节的豆包,月之暗面的KIMI, 智谱的GLM,美团的LongCat等。虽然我介绍了这么多大模型,但从身边认识的人来看,大家对这些模型的了解仍然有限,很多人只知道DeepSeek、豆包、KIMI这些模型。因此,我写这篇文章的目的是为了全面介绍主流大语言模型的比较及实战选型,帮助读者理解这些模型的优势与不足,从而在实际应用中做出明智选择。 ...

相关系数详解与应用

1 问题描述 我最近在复现一篇论文的实验:Speech Emotion: Investigating Model Representations, Multi-Task Learning and Knowledge Distillation(Mitra et al. 2022), 这是在MSP-Podcast(Busso et al. 2025)这个语音情感数据集上做Arousal,Valence, Dominace三个维度的回归任务。论文模型结构图如下 ...

Python函数的一些思考

我用Python写深度学习项目,用到最多的就是for循环遍历列表,但我一般是用AI辅助编程,对于AI生成的代码我只会大致理解其意思,并没有深入思考其内部逻辑。因为这个原因,这些代码使我不安,我写这篇博客的主要目的是通过对Python里一些常用函数用法的思考来加深对编程的理解。 ...

Hello World!

种一棵树最好的时间是十年前,第二好的时间是现在。