小模型Qwen-1.8B本机安装教程

最近折腾小模型,觉得小模型有机会成为大模型落地应用的一个途径。可以把大模型看作操作系统,小模型是操作系统上的应用。这样小模型的”小巧”,配合落地场景的个性化数据与应用需求,可能会解决大模型应用落地的问题。
我在两台机器上分别都部署了一次,过程非常简单,对机器配置要求不高,适合自己动手在本机部署模型玩一下的需求。

安装环境

台式机
操作系统:Windows10 WLS ubuntu22.04
CPU:Intel(R) Core(TM) i7-4790 CPU @ 3.60GHz   3.60 GHz
内存:16G
显卡:GTX745
PYTHON版本:3.10

笔记本
操作系统:Ubuntu 22.04.2 LTS
CPU:Intel(R) Core(TM)  i5-9300H CPU @ 2.40GHz × 8
内存:16G
显卡:NVIDIA Corporation GP107M [GeForce GTX 1050 3 GB Max-Q]
PYTHON版本:3.10

安装过程

一、建立安装空间和python虚拟环境。

在硬盘上建立一个Ai的文件夹,未来所有的安装和配置都在这个文件夹下进行。

mkdir Ai

在Ai文件里建立虚拟环境。

cd  Ai
python3 -m venv . (如果没有安装python的venv包,会提示进行安装)

进入到Python虚拟环境

source bin/activate

二、在Python虚拟环境下,进行Qwen-1.8B本机部署。
安装git。网上自行寻找安装教程。github的访问稳定性和速度,想办法解决吧。
在Ai目录下,下载Qwen包

git clone https://github.com/QwenLM/Qwen.git

进入到Qwen文件夹,安装运行需要的包。

cd Qwen
python3 -m pip install --upgrade pip (升级pip到最新版本,最好把pip源改成国内镜像)
pip3 install -r requirements.txt
pip3 install -r requirements_web_demo.txt

下载模型(需要先安装 Git LFS)
建立models文件夹

kdir models
cd models

#开始下载(时间和你的网络速度相关)
git lfs install  
git clone https://www.modelscope.cn/qwen/Qwen-1_8B-Chat.git

三,运行Qwen

从models目录回到你的Qwen目录下,修改文件web_demo.py,将默认模型文件的路径修改到你的路径。

DEFAULT_CKPT_PATH = '/Qwen/models/Qwen-1_8B-Chat' (最好写成绝对路径)

运行模式

python web_demo.py

看看效果

这样一个小模型在本机上跑,我的配置回复完成这些内容,需要2分钟左右吧。如果是一块好的显卡,估计飞快。github上有模型微调的教程,下一步可以根据找个教程,租用一个算力,自己动手微调一下这个模型。任何事物的学习,光看不动手,是学不到东西的。

大语言模型的未来:母体、应用还是分布式?

大语言模型(Large Language Models, LLMs)是采用神经网络进行无监督学习的语言模型。通过海量的数据,LLMs可以学习语言的统计规律和语义知识,并生成与输入语境相关联的自然语言。LLMs代表了基于深度学习的最新进展,在自然语言处理领域产生了里程碑般的影响。如BERT(Bidirectional Encoder Representations from Transformers)和GPT-3(Generative Pre-trained Transformer 3)就是两个典型的LLM实例。BERT是一个语言表示学习模型,可广泛应用于语言理解任务,如问答系统、文本分类与推荐等。而GPT-3是一个语言生成模型,可以根据提示语言生成连贯的文章、对话、故事等长文本。这两个模型均已在各自的方向上显示出超越人类的语言能力, 现在火遍全球的ChatGPT就是一种语言生成模型。(以上信息来源于百科+AI生成)
2023年可以说是全球大语言模型发展的元年,未来从基础应用场景上看,大语言模型(LLM)发展会有那些模式呢?尝试不成熟的胡想一通。未来大语言模型(LLM)发展的可能有三种模式。
第一种,母体模式。几个超大模型作为母体模型,利用自己超强的算力、算法能力和海量的可持续的数据积累,形成母体模型。围绕的母体模型,形成AI应用的生态。这种模式已初步形成,像ChatGPT已经开始构建相关应用生态。后续其他大模型的发展,必然会将生态应用一并考虑进去。
第二种,应用模式。随着大语言模型不断优化与发展,以及硬件设备算力成本的持续下降,使大语言模型的训练和部署对硬件需求不断减少。未来或许每个移动终端都可以运行自己的大语言模型。但是,每个人都拥有一个大模型似乎造成资源浪费,且模型个性化并不是一个容易解决的问题。
第三种,分布式模式。通过协议和网络连接,将大语言模型分布式部署。每个节点利用自己的数据进行本地训练,然后共享训练过程与结果。最终形成一个网络化大模型。这种模式理想但难度较大,一方面技术复杂,成本高;另一方面利益归属难以确定,管理难度大。
从当前发展来看,第一种母体模式可能性最大。第三种分布式模式虽然理想,但实践难度高,并且不符合资本与管理的诉求。第二种应用模式需要语言模型与硬件同步发展,但每个人拥有一个大模型的必要性值得商榷。
无论采取何种模式,大语言模型技术的发展已成必然。未来有一天,当我们再次购买移动终端设备的时候,里面默认安装的可能就不是一个操作系统了,还会有一个底层的AI系统,或者是具有AI能力的操作系统了。而移动终端上不再是一个个APP,而是一个个MAPP了。

小模型场景化应用,人工智能的下一站?

最近尝试了Qwen-1.8B这个小型AI模型,它的部署过程简单,对计算资源的要求不高,而其输出效果也不错。这让我在想,以小模型为核心的应用,是否会成为人工智能场景化应用的一种可能?
我们熟知的LLM(大型语言模型)应用,大多是通过与基座模型进行对话来实现。开发者通过特定的prompt来适配大模型的能力,以获得期望的输出。然而,这种方式存在一些局限:
● 用户可用的交互手段相对单一,主要是通过prompt进行。
● 交互的结果受限于大模型的预先训练和调教效果。
这些局限可能会阻碍用户在特定场景下实现专业化应用。尽管大模型提供了API接口,但对实现个性化和专业化的输入输出效果仍不够理想。
然而,对大多数场景和用户来说,部署和调教一个个性化的基座大模型是不切实际的。这时,小模型的优势就显现出来了。小模型源自大模型,通过2至3B的参数精调而成。它们相对独立,同时也能与大模型进行有效的信息和数据传输,类似于社区医院和三甲医院之间的关系。小模型部署在本地,进行个性化的调教与交互,遇到难题时可以通过与大模型的通信获得协助。这样,小模型将越来越场景化、专业化和个性化,而大模型则通过广泛的小模型应用,形成智能化生态,成为整个生态的“大脑”。
这种小模型和大模型的关系,与手机操作系统和应用商店之间颇为相似。操作系统负责驱动硬件,提供基础功能,而应用商店则利用这些基础功能,驱动手机硬件,生成个性化的APP应用。现在一个手机的应用动辄就是几个G,或者二三十个G,我测试玩Qwen-1.8B整个系统跑起来也不到10G的空间,对于当下的手机存储空间发展趋势来说,肯定是够用的。何况,基于小模型应用,核心模型大概率也是跑在应用的server端上。
小模型本地化应用还面临一个挑战,那就是手机算力。如果这条路走通,相信硬件厂商会迅速解决这个问题。毕竟,让全球集体更换一次手机,是任何硬件厂商都乐于看到的事情。
小模型本地化,个性化的调教,是可以尝试做一些人工智能场景化应用的。随着技术的不断进步和硬件的升级,模型能力,硬件算力和网路通讯能力都不会成为小模型应用的障碍。

2023年让我们随“势”而动

势,就是走势。走势是什么?走势是技术派,价值派,心里派,资金派,成长派等各派合力的结果。其实任何时候,我们都应该随“势”而动。走势告诉我们是什么,我们就是按着这个势去做交易。不管什么人说了什么,也不管什么派有什么样的武功秘籍。

30多年的走势,总体上一直在沿着20年均线向上走。每次20均线附近,都是某种机会的来临。

10多年的走势,总体上都是在10年均线那里展现机会。这就是走势。不要问为什么,因为任何原因都是某一个合力的解释,但是走势是多种力量,理由的综合结果。只要沿着势去交易就可以了。非要找个原因,讲个概念,那是经济学家和专家们混饭吃的把式,他们以此为生,对错都无所谓的。但是,钱是自己的,不能随意施舍。

2023年开始了,新的势也展现出来,要跟随这个势去交易。每一个势,机会都在它回调的时候。学会在回调的时候买入,是最安全的,也是最有效的。

像恒瑞医药这样的白马龙头,它的势已经展现出来了,那么就随“势”而动,有效利用它每一次回调的机会,慢慢和它磨。最后,获利一定颇丰。而且还安全,因为势好,又给予你充分的时间去做思考与行动。

每个人,交易的时候,都贪,都急,都三心二意。所以,好的股票总是错过,总是有遗憾。那是对势没有信心,没有耐心,也没有专心。

果断抄底!果然被套!教一招防狼术吧

上周你满腔热血的去“抄底”了吗?估计很多追进去的人周末都在做着下周如何赚钱的美梦!而那些因为害怕犹豫,上周没有买进的人,经过周末的“深思熟虑”,估计下周一开盘就要往里冲了。但是很多理智的人会说,我才不会这么笨呢,下周看看情况再说。不过下周红彤彤的k线图,不相信你还有什么理智存在。其实,这些都是所谓抄底人的日常。每一次,每一波人,都是这样重复着同样的行为。

市场很少有V型反转的。不管是什么人讲了什么话,也不管什么价值投资,更不管什么估值,市场有其自身的性格。剧烈的市场波动,意味着行情可能要发生转变了。但是可能性,不等于确定性。从上证的60分钟的走势图上,就能看到,其实每次市场的反转,都不是一蹴而就的,期间都会有一些反复的过程。底,从来不是某个点位,而是一个区间,成为底部区间。当你觉得市场属于底部的时候,那么就一定要利用好这个底部区间,去寻找更好的股票,得到更好的价格。

另外,当单盘的走势进入到底部的时候,个股们却不一定就在底部区间了。尤其是一些成长性的,概念性的个股,盘子不大,惯性却很强,经常会持续下跌,再给你来一个十八层地狱。所以,不能只看大盘去抄底个股。

缠师曾经说过,股票的走势就是两端盘整,中间趋势。目前的股市,还没开始盘呢,怎么就确定就走趋势了呢?

防狼术。以前讲过几次防狼术,其实很简单,就是看看比较大级别的MACD。作为PS,放到最后再唠叨两句。

这是000001平安银行。随便选一个,防止有推荐股票的嫌疑。以macd的0轴为观察点。一个上涨的走势,至少是macd上了0轴以后吧。那么如果macd在0轴一下的,肯定是下跌趋势了。一个股票,如果连这最基本的分类标准都达不到,怎么可能值得你去买呢?

大盘也是如此!就看你用什么级别的显微镜了。

回调才会酝酿机会,2022年把遗忘的寻回来

2022年的第一个月,大部分散户的心情不会好。开年第一个月继续延续着2021年末的下跌走势。说好降准的钱,也不知道跑到那里去了。说好的反转,替代成喋喋不休的下跌。而作为白马股和价值投资的信徒们,从2021年的夏天就开始进入漫漫跌途,不知道心中的信念,还剩下几分?

任何一个充分交易的证券市场,其走势都是各种合力共振的结果。个别的理论,消息等都无法去驱动市场的走势。这也是为什么一些方法会失效的原因所在。例如,最近降准了,这是一个重大的利好消息。如果你以此来作为判断依据,就开始买股票,那么肯定要受伤的。任何的消息,理论都必须放到一个整体里面,全面的进行考量。

这是上证的年线走势图。从图上判断,中国股市一直处于上涨的趋势里。只是趋势总是涨一涨,调一调。这种涨跌相间的走势本来是符合大自然的基本规律。如果天天涨,月月涨,最后肯定要毁灭。再看看最近几年的上证走势,已经连续三年走出阳线!这在历史上都是第一次。按着自然规律的选择,肯定是要面临回调的压力和风险。这个时候要是还在想着涨,或者侥幸的认为自己买个股票会与众不同,不受伤才怪!在证券交易里,永远不要期待自己是幸运的哪一个!

翻一翻深圳成指和创业板指,基本上都处于一种回调的状态,这就是市场整体的背景。2022年,我们必须正视现实,努力自我调整。而不是整天充满希望的去幻想我买的股票就一定会涨!2022,2023年市场整体回调一下5年线或者10年线都不是什么奇怪的事情。

当机会酝酿的时候,我们首先是耐心等待,然后睁大眼睛去观察那些果子先会长出来。就像上证50,你有多久没有看过他们了?都以为蓝筹,白马们都完蛋了?但是就在你完全遗忘的时候,机会可能正在悄悄的酝酿着。看看日线的走势,是不是基本上也进入到背驰段了?再跌一跌,你会不会认真考虑一下上证50里面的好股票呢?还有中证100,沪深300,恒瑞医药,中国平安,海螺水泥这些曾经的明星们,我们是不是遗忘的太久了?2022年,我们是不是应该再重新看看它们呢?

机会是跌出来,钱是涨出来的。让我们耐心,再耐心点。

周一追也许能薅根羊毛,再追就要当韭菜了

从图上看,很明显是盘整区间走势。周一的上涨,正好到了区间的上边缘。很多人可能因为今天的大涨又开始对股市有幻想,岂不知这就是一陷阱,等着你往里跳呢!

无人驾驶这样的板块,虽然今天涨的猛,也不过是因为华为造车这个小事件驱动了一下,长期性非常值得怀疑。而且这样一个小板块,是不可能带动整个市场的人气的。所以,薅薅羊毛就可以了,没必要太激动。

明天市场可能会有点调整,估计很多人又要待不住了,准备减点便宜往里冲,并且幻想美好的明天。今天进去的,明天后天还有机会赚点零花钱,但是明后天坚持不住冲进去的就只能在一段小盘整的纠结之后,被人再次当韭菜给割了!

各位好之为之吧!

现在的股市很简单,难的是你有一颗赌徒的游戏心

某股侠,用几个简单的数字对比,就把中国股市做到了3900点,这种儿戏一样YY,竟然有人信?这样的人注定是要被割韭菜的。现在中国的股市很简单明了,从技术上很明显的处于盘整的走势;从市场外部环境看,经济环境不可能马上改善;从市场内部来看,没明显的热点板块,没有明明显的资金增量,甚至存量有流出的迹象。这样叠加的市场,你还要涨,还梦想着赚钱,除非你是股神!不过,最近看哪些所谓的“股神”也死伤无数了。

从技术的角度来看,日线图上已经很明显的三段上涨的走势了,而2月18日就是那个高点。当时,是没有办法判断是不是到了最高点,不过现在一个很明显的盘整走势已经展开了,这个时候还要继续幻想着上3900点,那不是脑袋有问题了?盘整的走势最伤人!为什么?追涨杀跌啊!管你以前赚了多少钱,来回两三次就亏光了。目前,这个盘整的走势,在30分钟图上已经很明显了,未来这个盘整走势结束以后,可能还要面临者继续下跌的可能性。涨,跌,盘,市场的三种可能性,你非要时时刻刻的去相信涨这一种可能性,怎么可能不亏钱。而且从中国股市的长期走势来看,涨是三种可能性里最低的,持续时间最短的。

从交易量上看,市场的交易量最近也处于一种萎缩的状态,当下的市场是一种存量资金博弈的结构模式。而这种存量的资金,最近这两周来看,也是有流出的迹象的。

前期白酒,芯片几个龙头板块已经统统熄火了,新的市场热点还没有找到。外部的经济情况,大家应该可以感同身受。这种没走势,没交易量,没热点龙头,没支撑的四无市场,非要去YY上涨,这不是有毛病吗?

人,为什么会这样?因为去股市赚钱,做交易,对大多数人而言,是一场刺激的金钱游戏,大家真正喜欢的是那种交易的快感,和以此带来的梦想(其实就是白日梦)!这才是市场真正的真相!

期货交易笔记(1216):静待燃油的突破

很久没有更新期货交易笔记,最近错过了郑醇的牛市,是很大的损失。交易的门槛就是个人喜好,当个人的喜好与预期加入到交易中去的时候,交易会变得面目全非。这道门槛,目前没有迈过去。

燃油主力的周线图,从图上看,现在燃油处于上涨的初始形态,只是这个上涨的趋势还在隐隐约约,似有似无当中。

从小级别上看,燃油目前处于边界附近,就看最近形成的这个3小时的上涨走势是否能形成有效突破,进而带动周,日两个级别的上涨。

燃油现在处于一种很关键的时刻点,必须时时刻刻关注。忍耐,有耐心!