煙業(yè)智匯
零售戶在線
微薰
手機(jī)版
編者按:卷煙市場(chǎng)的價(jià)格波動(dòng)一直是行業(yè)關(guān)注的焦點(diǎn)。為了更好地理解市場(chǎng)狀態(tài)并做出合適的決策,本文將通過上下兩期文章去介紹如何通過隨機(jī)森林算法進(jìn)行卷煙市場(chǎng)價(jià)格預(yù)測(cè)及策略研究。
在“十三五”時(shí)期,我國經(jīng)濟(jì)發(fā)展進(jìn)入新常態(tài),宏觀經(jīng)濟(jì)轉(zhuǎn)型和產(chǎn)業(yè)結(jié)構(gòu)調(diào)整加速,卷煙消費(fèi)需求及環(huán)境發(fā)生顯著變化。“十四五”以來,行業(yè)全面應(yīng)用互聯(lián)網(wǎng)+、云平臺(tái)、大數(shù)據(jù)、AI等技術(shù),積極探索新一代信息技術(shù)在煙草“農(nóng)工商政”領(lǐng)域的融合應(yīng)用。根據(jù)市場(chǎng)價(jià)格指數(shù)、社會(huì)庫存等信息,去把握市場(chǎng)供需關(guān)系的微妙平衡,合理調(diào)配卷煙供應(yīng)、銷售結(jié)構(gòu)、投放策略,以確保高水平、高質(zhì)量的市場(chǎng)穩(wěn)定。
作為卷煙市場(chǎng)狀態(tài)的重要評(píng)判依據(jù)的市場(chǎng)價(jià)格,在任何市場(chǎng)狀態(tài)的評(píng)價(jià)中都屬于最核心的數(shù)據(jù)指標(biāo),為此工商公司通過多種途徑,以獲得市場(chǎng)價(jià)格的數(shù)據(jù)來源,從而保障在貨源投放數(shù)字化的基礎(chǔ)。
評(píng)價(jià)體系往往是通過已知的價(jià)格數(shù)值構(gòu)建價(jià)格指數(shù),另加其他終端指標(biāo)對(duì)市場(chǎng)進(jìn)行綜合評(píng)價(jià)。評(píng)價(jià)的方法基本都是通過多項(xiàng)指標(biāo)之間的權(quán)重進(jìn)行加權(quán)打分,如層次分析法、熵權(quán)法、變異系數(shù)法等,再通過閾值判斷其定性狀態(tài)。
這樣的判定方法有兩個(gè)缺陷,一是指標(biāo)較多,太多弱影響的指標(biāo)分去了評(píng)價(jià)的權(quán)重,導(dǎo)致評(píng)價(jià)的結(jié)果無法反映真實(shí)的結(jié)果,二是數(shù)據(jù)以靜態(tài)為主,缺乏預(yù)知性,對(duì)于調(diào)控而言存在一定的滯后性。
雖然預(yù)測(cè)是一個(gè)適應(yīng)性、準(zhǔn)確性難以把握的工作,但是它又有很高的必要性,尤其是當(dāng)前我們處于數(shù)字時(shí)代,面臨數(shù)字化轉(zhuǎn)型,由數(shù)字化向智慧化轉(zhuǎn)化,一定是通過機(jī)器學(xué)習(xí)的不斷迭代、更優(yōu)質(zhì)的數(shù)據(jù)采集以及市場(chǎng)的細(xì)分等,達(dá)到預(yù)測(cè)更精確、應(yīng)用更廣泛、場(chǎng)景轉(zhuǎn)化和適應(yīng)更靈活的目的。
針對(duì)以上兩個(gè)問題,首先要優(yōu)選指標(biāo),指標(biāo)的數(shù)量控制在合理范圍之內(nèi),既能保障評(píng)價(jià)的全面性,又能突出重點(diǎn)指標(biāo)的貢獻(xiàn)作用。二是通過已知有限的指標(biāo)集合,通過機(jī)器學(xué)習(xí)的方式對(duì)卷煙市場(chǎng)價(jià)格進(jìn)行預(yù)測(cè),形成動(dòng)態(tài)的價(jià)格參數(shù),用來彌補(bǔ)價(jià)格靜態(tài)的不足,對(duì)市場(chǎng)評(píng)價(jià)體系的綜合應(yīng)用具有重要的應(yīng)用價(jià)值。
考慮到煙草工業(yè)企業(yè)獲取數(shù)據(jù)的維度有限,選定進(jìn)貨戶數(shù)、上柜率、重購率、動(dòng)銷率、商業(yè)庫存、訂足面、斷貨率、訂單滿足率、競(jìng)品銷量9個(gè)指標(biāo)作為研究指標(biāo)(見表1),以某卷煙品牌規(guī)格在2019年10月-2023年6月的月度數(shù)據(jù)作為樣本。
表1指標(biāo)解釋
隨機(jī)森林算法可以用于分類和回歸,其中隨機(jī)森林分類是基于原始樣本集通過Bootstrap抽樣法抽取樣本子集構(gòu)建多棵決策樹,最終通過眾數(shù)投票的方式來決定最優(yōu)分類決策結(jié)果。核心思想是對(duì)訓(xùn)練集進(jìn)行自助采樣,組成多個(gè)訓(xùn)練集,每個(gè)訓(xùn)練集生成一棵決策樹,所有決策樹組成隨機(jī)森林,從而對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的機(jī)器學(xué)習(xí)算法。
1、某卷煙品牌的價(jià)格波動(dòng)情況
某卷煙品牌自2019年上市以來,2023年上半年銷量為1370箱,市場(chǎng)份額達(dá)到13.82%。但是市場(chǎng)價(jià)格從上市之初的270元/條,呈規(guī)律性的滑落(每年的5月以后價(jià)格小幅回升,到下半年7月左右又開始下滑,且屢創(chuàng)新低)。如圖2所示:
圖2某卷煙品牌自上市以來的價(jià)格波動(dòng)情況
2、價(jià)格波動(dòng)的影響因素重要性排序
通過對(duì)隨機(jī)森林模型的參數(shù)設(shè)置,其中內(nèi)部節(jié)點(diǎn)分裂的最小樣本數(shù)為2,葉子節(jié)點(diǎn)的最小樣本數(shù)為2,樹的最大深度為10,葉子節(jié)點(diǎn)的最大數(shù)量為50,決策樹數(shù)量為100,得到運(yùn)行結(jié)果,其特征重要性如圖3:可以發(fā)現(xiàn)訂足面重要性最高,其次是競(jìng)品銷量和庫存。
圖3隨機(jī)森林模型下的特征重要性排序
結(jié)語
我們可以看到,隨機(jī)森林模型在卷煙市場(chǎng)價(jià)格預(yù)測(cè)中表現(xiàn)出了良好的效果,通過隨機(jī)森林模型,可以分析出影響品牌價(jià)格波動(dòng)的因素,及其重要性排序,為行業(yè)提供了重要的決策參考。
隨著技術(shù)的進(jìn)一步發(fā)展,我們可以期待更多智能化的解決方案,從而促進(jìn)煙草行業(yè)的持續(xù)健康發(fā)展。