① 電影票房分析及預測
從20世紀初的西洋鏡戲法到今天占據全球電影業總產值的三分之一強,資本的加入讓好萊塢在過去百年的發展中變得越來越理智--比起商業片流水線締造者,它更像一個數學家--它精於計算每一項決定對利潤的貢獻:《蝙蝠俠》續集是否要接受男演員片酬的獅子大開口以獲得百分之幾的忠實粉絲買票入場;是否要在動作片的第37分鍾增加感情戲以爭取女性觀眾;是否要為這部爛透了的原著聘請收費高昂的劇本醫生;一個小金人編劇的名頭到底值多少錢……這就是在電影開機之前最為重要的環節:票房預測。
華爾街不僅給好萊塢帶來了密集的資金支持,也帶來了理性的金融工程技術,後者好像一把衡量藝術的尺子。一位浸淫於電影行業的金融人士一語中的:"在這個行業里充斥著曖昧不清、晦暗不明,有真正的藝術家、也有忽悠的吹水者,但到底怎麼判斷是否能合作,項目是否有投資價值,全憑經驗"。
如何預測
早在80年代,美國票房收入預測的先驅BarryLitman對美國80年代近700部電影進行分析推出票房收入預測模型。該系統對之後美國電影投資界產生了顛覆性的影響。電影票房預測系統能分析預測不同種類電影的票房價值,已經成為國際電影產業投融資的重要參考工具,對電影產品定價及衍生產品開發都具有較強的指導作用。
預測系統
電影票房量化分析及預測系統(Box Revenue Prediction)是在考察導演、主要演員、製片、發行及市場營銷、電影生命周期、電影類型、發行地區等影響電影票房的諸多因素基礎上,基於資產定價模型,綜合採用金融工程和回歸統計分析方法研發出的預測系統。它能分析預測不同種類電影的票房價值,成為電影產業投融資重要參考工具,對電影產品定價及衍生產品開發都具有較強的指導作用。
中國第一套BRP系統
2012年1月,中影集團聯合艾億新融資本推出了國內第一套基於電影票房預測的估值與定價分析系統--BRP系統。通過對過去4年中600多部影片的統計分析,該BRP系統發現了6條有趣的現象:
·低成本的影片一般會比大片更賣座
·無名小卒主演的影片要比明星主演的影片利潤率更高
·類型的藝術特徵跟利潤之間不存在直接關聯,但評論的多寡(無論好評或者劣評)跟利潤之間有密切關系
·不含暴力、色情成分的家庭影片最容易賺錢
·大片的續集要比普通新片更容易賺錢
·明星在為影片帶來更高票房的同時,也往往拉低了利潤率,因為大部分收入進了明星的口袋
② 數據挖掘 | 數據理解和預處理
數據挖掘 | 數據理解和預處理
小編遇到過很多人(咳咳,請不要對號入座),拿到數據後不管三七二十一,先丟到模型中去跑,管它具體什麼樣呢,反正「大數據」嘛,總能整出點東西來。
但就像上次說過的,「大數據」很有可能帶來「大錯誤」!所以在數據挖掘工作開始前,認真的理解數據、檢查數據,對數據進行預處理是至關重要的。
很多人說,數據准備工作真是個「體力活」,耗時耗力不說,還異常的枯燥無味。這點小編承認,建模之前的數據處理確實是平淡的,它往往不需要多高的智商,多牛的編程技巧,多麼高大上的統計模型。
但是,它卻能時時觸發你的興奮點,因為它需要足夠的耐心和細心,稍不留神就前功盡棄。
在這次的內容里,小編首先會從「數據理解」、「變數類型」和「質量檢查」三個方面進行闡述,然後會以一個自己做過的實際數據為例進行展示。
一、數據理解
拿到數據後要做的第一步就是理解數據。
什麼是理解數據呢?不是簡單看下有多少Excel表,有多少行,多少列,而是要結合自己的分析目標,帶著具體的業務需求去看。
首先,我們需要明確數據記錄的詳細程度,比方說某個網站的訪問量數據是以每小時為單位還是每天為單位;一份銷售數據記錄的是每家門店的銷售額還是每個地區的總銷售額。
其次,我們需要確定研究群體。研究群體的確定一定和業務目標是密切相關的。
比方說,如果我們想研究用戶對產品的滿意度與哪些因素有關,就應該把購買該產品的所有客戶作為研究群體;如果我們想研究用戶的購買行為受哪些因素影響,就應該同時考察購買人群和非購買人群,在兩類人群的對比中尋找關鍵因素。
研究群體的確定有時也和數據的詳細程度有關。
比如我們想研究「觀眾影評」對「電影票房」的影響,我們既可以把「每部電影」看成一個個體,研究「影評總數」對「電影總票房」的影響,也可以把「每部電影每天的票房」看成一個個體,研究「每天的影評數」對「每天的電影票房」的影響。
具體選擇哪一種取決於我們手上有什麼樣的數據,如果只有總票房和總影評數的數據,那我們只能選擇第一種;如果有更詳細的數據,那就可以考慮第二種方案。
需要注意的是,這兩種方案還會影響我們對於模型的選擇。
例如,如果研究「每天的影評數」對「每天電影票房」的影響,那每部電影又被細分為很多天,同一部電影不同時間的票房會有較高的相似性,這就形成了一種層次結構,可以考慮使用層次模型(hierarchical model)進行分析。
最後,當我們確定了研究目標和研究群體後,我們需要逐一理解每個變數的含義。有些變數和業務目標明顯無關,可以直接從研究中剔除。
有些變數雖然有意義,但是在全部樣本上取值都一樣,這樣的變數就是冗餘變數,也需要從研究中剔除。
還有一些變數具有重復的含義,如「省份名稱」和「省份簡稱」,這時只需要保留一個就可以了。
二、變數類型
所有變數按其測量尺度可以分成兩大類,一類是「分類變數」,一類是「數值變數」。不同類型的變數在處理方法和後期的模型選擇上會有顯著差別。
【分類變數】
分類變數又稱屬性變數或離散變數,它的取值往往用有限的幾個類別名稱就可以表示了,例如「性別」,「教育程度」,「收入水平」,「星期幾」等。細分的話,分類變數又可分為兩類,一類是「名義變數」,即各個類別間沒有順序和程度的差別,就像「手機系統」中ios和安卓並沒有明顯的好壞差別,「電影類型」中「動作片」和「科幻片」也都是一樣的,說不上哪個更好或更差。
另外一類是定序變數,即不同類別之間存在有意義的排序,如「空氣污染程度」可以用「差、良、優」來表示、「教育程度」可以用「小學、初中、高中、大學」來表示。
當研究的因變數是分類變數時,往往對應特定的分析方法,我們在後面的章節會陸續講到,這里暫且不談。
當研究中的自變數是分類變數時,也會限制模型選擇的范圍。有些數據挖掘模型可以直接處理分類自變數,如決策樹模型;但很多數據挖掘模型不能直接處理分類自變數,如線性回歸、神經網路等,因此需要將分類變數轉換成數值變數。
對於定序自變數,最常用的轉換方法就是按照類別程度將其直接轉換成數值自變數,例如將空氣污染程度 「差、良、優」轉換為「1,2,3」。
對於名義自變數,最常用的轉換方法就是構造0-1型啞變數。例如,對於「性別」,可以定義「1=男,0=女」。
當某個名義變數有K個類別取值時,則需要構造K-1個啞變數。例如教育程度「小學,初中,高中,大學及以上」,可以構造三個啞變數分別為:x1:1=小學,0=其它;x2:1=初中,0=其它;x3:1=高中,0=其它。當x1,x2,x3三個啞變數取值都為0時,則對應著「大學及以上」。
需要注意的是,有時候名義變數的取值太多,會生成太多的啞變數,這很容易造成模型的過度擬合。
這時可以考慮只把觀測比較多的幾個類別單獨拿出來,而把剩下所有的類別都歸為「其它」。
例如,中國一共包含56個民族,如果每個民族都生成一個啞變數就會有55個,這時我們可以只考慮設置「是否為漢族」這一個0-1啞變數。
【數值變數】
我們再來看看數值變數。數值變數就是用數值描述,並且可以直接進行代數運算的變數,如「銷售收入」、「固定資本」、「評論總數」、「訪問量」、「學生成績」等等都是數值變數。
需要注意的是,用數值表示的變數不一定就是數值型變數,只有在代數運算下有意義的變數才是數值型變數。
例如財務報表的年份,上市時間等,雖然也是用數值表示的,但我們通常不將它們按照數值型變數來處理。
上面我們講到,分類變數通常要轉換成數值型變數,其實有些時候,數值型變數也需要轉換成分類變數,這就用到了「數據分箱」的方法。
為什麼要進行數據分箱呢?通常有以下幾個原因:
1. 數據的測量可能存在一定誤差,沒有那麼准確,因此按照取值范圍轉換成不同類別是一個有效的平滑方法;
2.有些演算法,如決策樹模型,雖然可以處理數值型變數,但是當該變數有大量不重復的取值時,使用大於、小於、等於這些運算符時會考慮很多的情況,因此效率會很低,數據分箱的方法能很好的提高演算法效率;
3.有些模型演算法只能處理分類型自變數(如關聯規則),因此也需要將數值變數進行分箱處理。
數據分箱後,可以使用每個分箱內的均值、中位數、臨界值等作為這個類別的代表值,也可以直接將不同取值范圍定義成不同的類別,如:將污染程度劃分後定義為「低、中、高」等。
那如何進行數據分箱呢?常用的數據分箱的方法有:等寬分箱(將變數的取值范圍劃分成等寬的幾個區間)、等頻分箱(按照變數取值的分位數進行劃分)、基於k均值聚類的分箱(將所有數據進行k均值聚類,所得的不同類別即為不同的分箱),還有一些有監督分箱方法,如:使分箱後的結果達到最小熵或最小描述長度等。這里不詳細介紹了,有興趣的童鞋可以自行網路。
三、質量檢查
對數據中的各個變數有了初步了解後,我們還需要對數據進行嚴格的質量檢查,如果數據質量不過關,還需要進行數據的清洗或修補工作。
一般來說,質量檢查包括檢查每個變數的缺失程度以及取值范圍的合理性。
【缺失檢查】
原始數據中經常會存在各種各樣的缺失現象。
有些指標的缺失是合理的,例如顧客只有使用過某個產品才能對這個產品的滿意度進行評價,一筆貸款的抵押物中只有存在房地產,才會記錄相應的房地產的價值情況等。
像這種允許缺失的變數是最難搞的,因為我們很難判斷它的缺失是合理的,還是由於漏報造成的。
但無論哪種情況,如果變數的缺失率過高,都會影響數據的整體質量,因為數據所反映的信息實在太少,很難從中挖掘到有用的東西。
對於不允許缺失的變數來說,如果存在缺失情況,就必須進行相應的處理。如果一個變數的缺失程度非常大,比方說達到了70%,那就考慮直接踢掉吧,估計沒救了。
如果缺失比例還可以接受的話,可以嘗試用缺失值插補的方法進行補救。
插補的目的是使插補值能最大可能的接近其真實的取值,所以如果可以從其他途徑得到變數的真實值,那一定優先選擇這種方法。
比如某個公司的財務信息中缺失了「最終控制人類型」和「是否國家控股」這兩個取值,這些可以通過網上的公開信息得到真實值;再比如缺失了「凈利潤率」這個指標的取值,但是卻有「凈利潤」和「總收入」的取值,那就可以通過變數間的關系得到相應的缺失值,即凈利潤率=凈利潤/總收入。
當然,更多的時候,我們無法得到缺失值的真實信息,這時就只能借用已有的數據來進行插補了。
對數值變數來說,可以用已觀測值的均值、中位數來插補缺失值;對分類型變數來說,可以用已觀測數據中出現比例最高的類別取值來進行插補。
這些方法操作起來非常簡單,但它們都是對所有缺失值賦予了相同的取值,所以當缺失比例較大時,可能會扭曲被插補變數與其餘變數的關系。
更復雜一點的,我們可以選擇模型插補方法,即針對被插補變數和其它自變數之間的關系建立統計模型(如回歸、決策樹等),將模型預測值作為插補值。
如何處理缺失值是一個很大的研究課題,我們這里只是介紹了最簡單可行的方法,有興趣的讀者可以參閱Little和Rubin 2002年的專著「Statistical Analysis with Missing Data」。
【變數取值合理性檢查】
除了缺失外,我們還要考察每個變數的取值合理性。每個變數都會有自己的取值范圍,比如「用戶訪問量」、「下載次數」一定是非負的,「投資收益率」一定在0~1之間。通過判斷變數的取值是否超出它應有的取值范圍,可以簡單的對異常值進行甄別。
除了根據變數的取值范圍來檢查變數質量外,還可以根據變數之間的相互關系進行判斷。例如一家公司的「凈利潤率」不應該大於「總利潤率」等。
只有通過了各個方面檢測的數據才是一份高質量的數據,才有可能帶來有價值的模型結果。
四、實例分析——電影票房分析
最後,我們給出一個實例分析。在這個例子中,我們的目標是研究電影哪些方面的特徵對電影票房有影響。
我們有兩方面的數據,一是描述電影特徵的數據,二是描述電影票房的數據。
由於我們關注的是北美的票房市場,所以描述電影特徵的數據可以從IMDB網站得到,它是一個關於演員、電影、電視節目、電視明星和電影製作的在線資料庫,裡面可以找到每部上映電影的眾多信息;電影每天的票房數據可以從美國權威的票房網站Box Office Mojo得到,上面記錄了每部電影上映期間內每天的票房數據。
我們將從IMDB得到的數據放到「movieinfor.csv」文件中,將從Box Office Mojo中得到的數據放到「boxoffice.csv」文件中。
這里,我們以2012年北美票房市場最高的前100部電影為例進行講解。下表給出了這兩個數據集中包含的所有變數以及相應的解釋。
在這兩個數據中,movieinfor.csv數據的記錄是精確到每部電影的,而boxoffice.csv數據精確到了每部電影中每天的票房數據,是精確到天的。上表中給出的變數中,除了電影名稱和ID外,「電影類型」「MPAA評級」(美國電影協會對電影的評級)和「星期幾」是分類型變數;「放映時長」、「製作預算」、「電影每天的票房」和「每天放映的影院數」是數值型變數。兩份數據都不存在缺失值。
我們首先對兩個數據集分別進行變數預處理,然後再根據電影ID將兩個數據整合到一起。下面給出了每個變數的處理方法:
【電影類型】
電影類型是一個分類變數。在這個變數中我們發現每部電影都不止一個類型,例如「The Dark Knight Rises」這部電影就有「Action」、「Crime」和「Thriller」三個類型,並且它們以「|」為分隔符寫在了一起。
同時,不同電影之間可能有相同的類型,也可能有不同的類型,例如票房排名第二的電影「Skyfall」,它的類型是「Action |Adventure |Thriller」。
因此,我們首先需要做的是把每部電影所屬的類型逐一取出來,然後將所有出現過的類型分別形成一個0-1啞變數,如果這部電影在某個類型上出現了,則相應變數的取值就是1,否則是0.
通過上面一步,我們知道這個數據集中出現過的所有電影類型一共有11個。
那是不是按照之前所講的,應該把它轉換為10個啞變數呢?這里需要注意的是,所有的電影類型之間並不是互斥的(即有了action,就不能有其他的類型),所以我們無需因為共線性的原因去掉其中一個。
也就是說,如果把每一個電影類型單獨作為一個獨立的變數,可以衍生出11個新的0-1變數,這完全沒有問題。但11個變數未免有點過多,所以我們根據不同電影類型的頻數分布情況,只把出現次數明顯較多的類型單獨拿出來,最終生成了6個0-1型變數,分別為Adventure,Fantasy,Comedy,Action,Animation,Others。
【MPAA評級】
對於這個分類型變數,我們首先可以看一下數據中它所包含的全部取值,發現一共有「PG」,「PG-13」和「R」三個。
和上面的電影類型(Genre)不同,對於一部電影而言,它只能有一個MPAA取值。因此,在MPAA變數中,我們需要選擇一個作為基準,將另外兩個構造成啞變數。
例如,我們以「PG」為基準,構造的兩個啞變數分別為PG13和R,如果這兩個啞變數的取值同時為0,那就相當於電影的MPAA評級是PG。
【放映當天是星期幾】
這個變數同MPAA評級一樣,每部電影只能有一個取值。
如果它在星期一到星期日上都有取值的話,我們可以衍生出6個0-1型啞變數。
因為這里我們更關注周末和非周末對電影票房的影響,而並不關注具體是哪一天,所以我們將其進一步概括成一個變數,即「是否是周末」。
【放映時長和製作預算】
放映時長和製作預算這兩個變數都是取值大於0的數值型變數,我們可以分別檢查它們的取值是否在合理的范圍內,然後直接保留它們的數值信息。
同時,對「製作預算」而言,假設我們這里關心的不是製作預算的具體數值,而是「小成本電影」和「大成本電影」的票房差異,那我們就可以將這個數值型變數進行分箱處理,轉換為一個0-1型的分類變數,即 「是否為小成本電影」。
在決定按照什麼標准來劃分是否為小成本電影時,我們根據之前文獻里的研究結果,將製作預算在100 million以下的電影看成是小成本電影。
上述所有變數的處理過程都可以使用R中最基本的語句(table,rep,which等)完成,由於篇幅限制,小編這里就不列出詳細的code了,大家感興趣的話,可以閱讀狗熊會的「R語千尋」系列(戳這里),相信會在R語言的學習上受到更多啟發。
最後,我們將所有新生成的變數按照電影ID整合到一起,就大功告成啦。
五、總結
最後總結一下,小編在這次內容中向大家介紹了拿到數據後的數據理解和預處理工作,內容雖然不難,但同樣需要我們認真對待。就好像生活一樣,只有踏踏實實走好前面的路,才有可能迎接後面的高潮迭起!
③ ERP系統優點有那些
ERP系統優點:1、 同時適用於離散型(ASSY)、連續型(Process)、混合型(Mix)等製造業生產型態2、 可同時應用於接單生產(Make to Order)、計劃性生產(Make to Stock)、來料加工(Consign Material)等營業型態之製造業3、 全球唯一具備動態式物料控管技術(Dynamic MRP2)與高速神經網路技術(Q.R.M.)實作之製造信息管理系統之顧問公司4、 唯一具備快速減肥健身BPR(Bussiness Process Reengineering)企業流程再造技術之信息顧問公司5、 可同步應用物控七大手法MRP2、Forecast、JIT、Dyanmic SCM、Reorder Point FCST、P/O Benk、Turnover、Others6、 提供生管大排程、小排程、在線實時排程等生產管制(CRP)之APS先進規劃與排程7、 (Advanced Planning and Scheling),接受實體(Physical)數據和虛擬(Phanton)數據進行供需變更之靈活性模擬8、 具備六大賬冊自動登錄並能相互稽核的ERP整合系統9、 具備完善之整合式後勤(Integrate Logistics)功能-整合內外, 以縮短訂購周期減少營運開銷10、 (Advanced Planning and Scheling),接受實體(Physical)數據和虛擬(Phanton)數據進行供需變更之靈活性模擬11、提供全球唯一快速應變客戶訂單變更、計劃變更、產品設計變更的異常處理技術, 十分鍾內完成各部門應變處理作業12、提供自動立體倉儲(AS/RS)與ERP無縫介面之實時協同運作13、提供現場監控(MES/MCS,Manufacturing Executive System/Manufacturing Control System)系統和各種Barcode條形碼系統與ERP無縫介面之實時協同運作14、 唯一具備內崁式電子文件簽核管理的ERP, 並可直接在線批示, 避免外掛WorkFlow造成重復登打單據數據15、具備崁入式之客戶關系管理(CRM,Customer Relationship Management)和產品研發管理(PDM,Proct Data Management)與ERP之實時協同運作16、 整合進出口關稅合同核銷與保稅管理17、具備六大賬冊自動登錄並能相互稽核的ERP整合系統18、完善整合與產生兩岸三地關系人交易與相關帳務; 具備EDI與EC國際化電子數據交換之成熟功能19、具備國際集團/國內集團運籌管理、財務匯總(合並報表)、資金調度之功能20、提供高階主管信息系統EIS(Exccutive Information Systems)做經營分析、決策支持DSS(Decision Support Systems)、KPI績效管制之圖形化視覺管理功能(BI)21、提供Virtual Factory(虛擬工廠)的信息通透技術, 讓客戶、業務與生管之間的溝通、咨詢、管理獲得徹底的疏解22、將ERP、APS、EDI、PDM、MES、MCS、SCM、CRM、EC、EIS、DSS、BI與Intranet/Extranet等以系統崁入式或ERP無縫介面之實時協同運作, 完整建構出電子商務(e-Bussiness)與虛擬企業整合(VEI,Virtual Enterprise Integation)之全球運籌競爭系統23、強大人事管理模塊,提供客戶全面的人事管理。24、料品單位可以靈活多樣。一般系統提供的是兩個單位,即:交易單位和庫存單位;IEERP除了這兩個單位外,還可以根據客戶需要,對料品使用更多的單位進行管理,比如醬油,有瓶、箱、袋,還有散裝的:斤、公斤等等!(對同一料品由於包裝方式的不同引發的多單位進行自動換算靈活處理)25、BOM產品結構中有並產料號功能,針對於投入相同原料產出多種完成品產業,可大量減少BOM數量和工令單數量,提高管理和工作效率,並可核算各相應完成品的成本。26、針對各不同BOM可設置相應的損耗率,BOM用量更准確成本更准確。27、庫存管理採用條碼系統。庫存管理更准確效率更高(系統能在一般A4普通上印出條形碼進行掃描,無須使用專門的條形碼標簽紙,節約N多成本)。28、訂單管理具有附加件功能,更靈活實現各客戶不同需求,並減少料號和BOM的數量,便於管理和提高作業效率。29、項目帳 所有材料、成品、半成品、在產品及有關銷貨成本、銷貨收入所涉及的每一個料品的每一筆進出明細帳均自動形成,進出口費用也由USER設定相關分攤方式進行電腦自動分攤,(無須手工KEY入),所有帳冊完整准確顯示。30、生產管理。生產管理可以管理到每一加工步驟,反映每一步的加工進度,便於更詳細掌握生產進度。31、途程外包功能,減少料號和BOM,並便於管理和提高效率。32、生產排程管理。據客戶訂單交期自動排程,能針對工廠多變的行事歷、產能異常、標准工時的不準確等,做相應生產計劃的自動調整,並能以生產計劃為依據來安排物料采購及入料計劃。提供查核延誤交期的工單和訂單明細,調整產能後,可在進行排程重排。自動排程效率高、反應快,解決企業手工或半自動排程因企業內部和外部環境的多變造成的困擾。33、物料管制管理,能做到核算企業長期、中期、短期的物料需求計劃,使企業掌握長期、中期、短期的物料需求計劃,更好的做好物料控制提高資金利用率、減少呆滯料和資金佔用。34、工令單備料狀況模擬。對待生產工令單物料狀況做模擬,減少停工待料現象的發生,有不足料時及時轉催料單。35、訂單/計劃訂單變更備料模擬,對相應變化做差異比較,並產生相應的變更,提高變更的快速反應和處理能力,以提高企業竟爭力。36、提供采購廠外代驗功能,減少出入庫作業,並准確快速的處理相應物流和帳流。37、提供外包廠外代驗功能,減少出入庫作業,並准確快速的處理相應物流和帳流。38、成本准確快速。根據進銷存、生產前端資料快速准確核算產品的成本,讓成本人員更多時間做成本分析工作,以便做成本的改善和控制。39、成本可做到依事業部別切相應銷貨成本,以達到核算事業部損益。40、財務部份滿足本地化需求,會計科目、會計報表、帳冊、會計憑證等符合大陸要求,可快速申請脫離手工帳。41、會計科目中設置』立沖要件』功能,可減少會計科目的數目,又可達到多種多樣的核算要求。42、人事薪資可自動核算三險一金,並可做到薪資核算依計時或計件來做工資核算。43、疋數明細。對於電線電纜,紡織等行業中涉及同一料品不同的軸數及疋數明細,電腦自動記錄出入帳,且能在出貨時依照出貨總數進行電腦自動擇軸(疋)數進行匯總出貨,無須人工進行自動加總出貨。44、變動特性。可以管理具有多種特性的材料,從而減少材料的編號,系統還可以自動為多種特性的材料自動編號。45、基於Internet平台的解決方案,有助於用戶跨地區訪問系統。46、應用伺服器與資料庫伺服器分離,提高數據的安全性。47、各模塊可以靈活組合,客戶可以根據自身需要,任意挑選其中的模組。48、具有集團性公司所需的財務會計總帳匯總系統。49、每月可通過回轉分錄作業自動計算進料的暫估料款和應收/應付/票據/外幣存款和現金的匯兌損益,並自動切出相應的會計分錄。50、各模塊以流程圖作導向,可以全面快速了解各模塊流程。51、每一維護子畫面有詳細的幫助說明文件,包括欄位說明、前置作業、作業注意事項等。
④ 什麼是神經網路
神經網路可以指向兩種,一個是生物神經網路,一個是人工神經網路。
生物神經網路:一般指生物的大腦神經元,細胞,觸點等組成的網路,用於產生生物的意識,幫助生物進行思考和行動。
人工神經網路(Artificial Neural Networks,簡寫為ANNs)也簡稱為神經網路(NNs)或稱作連接模型(Connection Model),它是一種模仿動物神經網路行為特徵,進行分布式並行信息處理的演算法數學模型。這種網路依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。
人工神經網路:是一種應用類似於大腦神經突觸聯接的結構進行信息處理的數學模型。在工程與學術界也常直接簡稱為「神經網路」或類神經網路。
⑤ 新媒體時代電影產業發展呈現出哪些新趨勢
一、改變電影理論和形態的新媒體電影
新媒體電影首先必須滿足「電影」的基本條件:作品無論從內容形式還是觀眾角度都被認為是電影。這條標准將互聯網之上無數隨機的和零碎的小視頻排除開來,但是電影和非電影之間的區分沒有那麼簡單。關於什麼是電影,電影理論史上主要有自然實用主義(巴贊、克拉考爾)和藝術純粹主義(愛因漢姆、愛森斯坦)兩種傾向:前一種主張電影是人類通過膠片完成對自然再現的沖動,後一種認為電影具有獨立於其他藝術門類的純粹藝術性①,後續還包括麥茨的以鏡頭為單位的無代碼語言,斯坦利·卡維爾的「連續自動的世界影像」說等②。以上這兩種主要的電影理論都試圖解釋什麼是電影或者說電影與其他藝術的差異性。然而我們也必須意識到,這些從本體上對電影進行的形而上思考無論多麼哲學化,「什麼是電影」的理論根基依然是電影藝術本身所寓居的媒介。當電影擺脫銀幕、膠片的束縛,進入數字化和網路化之後,關於「什麼是電影」的思考必然會發生變化。所以,媒介刺激下生成的新媒體電影(比如優酷出品的「11度青春電影行動」《老男孩》等),必然具有與傳統電影不同的內涵和氣質。因而,新媒體電影不一定必須符合傳統電影理論之中的「電影」概念才能被視為電影藝術。比如早期翻拍、篡改型的新媒體電影《一個饅頭引發的血案》、《網路驚魂》等,完全是以對傳統電影的解構為基礎的。由此,我們可以看到電影的內涵正在被新媒體電影實踐拓寬。
與此同時,新媒體電影與傳統電影,從生產到傳播、到批評和理論建構展現出巨大的差異。第一,互動性是新媒體電影的首要特徵。網路本身所具有的互動機制,使得新媒體電影從構思到籌備,再到劇本、演員,最後到剪輯等環節都可以吸取大量受眾的意見。人的天性之中就具有對對象的一種控制欲,因而互動性將電影的可控感上升到電影歷史的新高度。比如,國際高端家電品牌卡薩帝(Casarte)的新媒體電影《獨家》,其結構不是線性的,而是開放式的。其最為典型的互動性就是觀眾可以左右整部電影的劇情,最後呈現出開放式的主題和五種不同的結局選擇。同時,整個新媒體電影演進過程之中會有暗藏的二維碼以供觀眾掃描,從而體驗更多精彩的互動。第二,新媒體電影寄寓的媒介是互聯網。首先,互聯網路所具有的去中心化特質使得新媒體電影界呈現出眾聲喧嘩的草根性。自媒體、新媒體的發展使得人們對電影的追求不再受限於傳統意義上的電影體制,普通人甚至可以根據自己的需求拍攝新媒體電影。這帶來一個疑問:人人都可以拍電影的話,如此的新媒體電影還是電影或者好電影嗎?我們承認人人參與之後,電影作品之中肯定會出現參差不齊的情況,但是網路就是一個大浪淘沙的過程,優秀的作品是不會被網路遺忘的,相反會成為新媒體電影的一根一根標桿,激勵後來者繼續創新。其次,互聯網觀影不可能具有大場景、大製作、IMAX影院、逼真特效等等優勢,但是影院型電影由於過於關注電影技術給人帶來的那種沖擊性、刺激感和亦真亦幻的效果,反而對電影題材選擇、故事情節演進和電影本身深度缺乏重視。在這種情況下,新媒體電影尋求不同於大場景、大投資電影的路線,將重心放在怎樣講好故事上。網路居民不可能有耐心將時間花在一部情節毫無吸引力的新媒體電影上而忽略網路上海量的電影資源。這使得新媒體電影在講好故事和故事創新上都有更高的要求。再次,新媒體電影潛在觀眾大。新媒體電影通過網路進行視頻傳播,其受眾是廣大網民。根據2014年發布的第33次《中國互聯網路發展狀況統計報告》稱,截止2013年12月,我國網民規模達到6.18億,網路視頻用戶規模達4.28億,較上年底增加5637萬人,增長率為15.2%。網路視頻使用率為69.3%,與上年底相比增長3.4個百分點③。作為網路視頻之中優質視頻的新媒體電影,它必然會隨著視頻用戶激增的速度和規模而顯示出與傳統電影分庭抗禮的力量。
從上面新媒體電影呈現出來的幾個特徵(去中心化、受眾巨大、互動性強)之中,我們可以發現新媒體電影已經徹底打破了傳統以導演為主導的電影製作模式。傳統電影製作過程中,從劇情發展、拍攝進度、場景選取、演員選用、鏡頭取捨、段落安排,後期的剪輯、配音、效果等環節,一切都由導演決定。新媒體電影選擇以網路為平台,集合廣大網民的力量及意願,比如「選拔網路自薦的新銳導演;審核通過網路徵集的電影劇本並進行專業篩選、加工製作;對投資拍攝的劇組進行統籌監控,盡量避免資金浪費;對遍布全國的新媒體電影生產基地進行管理,以確保新媒體電影的生產量」④。因此,在新媒體電影之中,內容的生產者和消費者呈現合一的趨勢,即作者與讀者逐漸混融的狀態。這種特徵我們稱之為新媒體電影元素的網路混融階段。這一混融趨勢在大數據時代更是得到了進一步強化。
二、大數據時代對於新媒體電影意味著混融狀態
大數據作為網路理論和實踐的新範式是近幾年才興起的,之後迅速在管理、傳播、政治、商業和金融等領域興盛。大數據的含義就是通過各種新媒體對使用媒體的用戶所產生的信息進行數據最大化收集、整理、分析,從而預測未來的發展趨勢。它具有四個特點:巨大的數據量和數據完整性,能在看似毫不相關的數據之間找到內在關聯,即時滿足需求和尋找出數據背後的價值。最典型的是2013年風靡全球的美劇《紙牌屋》充分實現了大數據在藝術實踐之中的巨大價值。它完全繞開了廣播電視網和有線電視網所構成的傳統電視生態系統,選擇在Netflix視頻網站播放,用戶只需要通過個人電腦或者移動終端登錄即可播放。Netflix採用了真正的大數據分析——3000萬用戶的收視選擇、400萬條評論、300萬次主題搜索。同時,所有通過Netflix觀看《紙牌屋》的觀眾會在觀看過程之中產生無數的連觀眾自己都沒有意識到的數據(包括觀看連續劇時暫停、回放、快進、停止等動作都會被一一記錄下來,每天用戶在Netflix上將產生高達3000多萬個行為)。這些數據通過網站後台被迅速分析,從而讓電視劇製作商做出相應的對策。該劇在拍攝過程之中,真正實踐了大數據精神,無論是劇情設置還是選擇演員、導演陣容,都以用戶在網站上的行為和使用數據做支撐。「Netflix尚且可以利用大數據分析巨量用戶的需求,不僅是誰喜歡看什麼節目,更精確到用戶行為:什麼人喜歡在星期天晚上用平板設備看恐怖片;哪些人會打開視頻就直接跳過片頭;看到哪個演員出場會快進;看到什麼劇情會重放,《紙牌屋》的商業奇跡正是通過雲計算精確整理重點關聯數據而造就的」⑤。從《紙牌屋》的運作可以看出,在大數據分析時代,藝術作品的作者和受眾形成了巨大而緊密的關聯性。在這種關聯性之中「作者—受眾」的關系分為兩層:一層是新媒體的即時互動性帶來的受眾對作者的即時反饋信息,使得作者可以即時調整創作的路線;另一層是作為消費者的信息生產,也即阿爾文·托夫勒在《財富的革命》之中提到的「生產者即消費者」⑥。閱讀時,受眾在電腦或閱讀器上產生的大數據通過網路被收集匯總到存儲器,通過大數據分析,提煉出多少受眾觀看到哪個地方放棄了觀影,哪些觀眾對哪些人物角色感興趣,觀看時嵌入哪些相關圖片或者視頻更有助於電影的接受等。
大數據時代造就的新媒體電影的「作者—受眾」混融具有與網路時代新媒體電影中創作者和觀眾混融不一樣的內涵。新媒體藝術家阿斯科特認為,網路造就了空前規模的集體智能,一種集體認知的全球網路,從而產生了「超思想」、」超精神作用」、「智力網路」等。在這一過程中,個人的神經網路融合於全球網路以創造意識的新空間⑦。就好比大海之中的小魚和合而成的魚陣一樣,並沒有任何一隻凌駕在所有魚之上的領袖指揮它們,它們只是自發組合排列形成比海里最大的魚還大的巨型「大魚」。這條「大魚」具有整體生命,無數個體小魚已經成為大魚的組成細胞。新媒體電影也一樣,參與電影活動的無數創作者、觀眾、中間人圍繞著一部電影,他們通過大數據參與到整個電影的創作當中。相對於電影,這些參與者,全都成為了像「大魚」一樣的「作者」。
大數據的「大」體現在「全數據」模式之上,即我們分析的不是樣本數據,而是所有數據⑧。人類步入信息時代,人類的網路行為所產生的所有數據都可以被存儲、交換和分析使用,並且這些數據量之大,令人不可思議。2013年中國產生的數據總量超過0.8ZB(相當於8億TB),兩倍於2012年的數據量,相當於2009年全球的數據總量。預計到2020年,中國產生的數據總量將是2013年的10倍,超過8.5ZB⑨。那麼,這樣大規模的數據對於生根於互聯網的新媒體電影又意味著什麼呢?
新媒體電影是以個人電腦和移動終端及連接它們的網路設備作為承載的。新媒體背後有大量資料庫隨時更新電影生產和消費的各種數據,包括新媒體電影的宣傳數據,電影觀眾觀看的時間,觀眾的性別、族裔、年齡、群體、受教育程度,新媒體電影的交易量,電影播放到哪裡丟失的讀者最多,哪些電影部分會被反復觀看等等。數據來源可以多樣化,不同渠道的數據甚至可以互相參照。「第一是搜索平台,如網路、谷歌、搜狗;第二是社交平台,如微博、人人網、豆瓣、時光網;第三是電商平台,如網票網、美團網、淘寶網等;第四是視頻網站,如優酷、土豆、愛奇藝、樂視網等。像網路指數、新浪微指數、淘數據、優酷指數等,都是由上述平台提供數據服務的。此外,國家電影專項資金辦公室擁有全國的影院票房數據,並通過《中國電影報》等平台向社會公布」⑩。與此同時,數據平台也需要龐大的數據作為支撐。由於新媒體電影的開放性和資源共享性,使得新媒體電影創作和觀看數量巨大,從而產生的數據也是前所未有的。大數據的關鍵作用還在於對未來進行預測。全數據對於大數據分析來說就是「正在發生的未來」。通過對電影本身、觀看和批評、媒體、電影宣傳等相關數據的搜集,尋找觀眾興趣點,預測哪種審美趣味的電影會在什麼樣的人群中受歡迎,人群的性別、消費力、居住區域、階層、年齡段分布等等。利用數據作為分析受眾的依據之後,創作者不需要挖空心思去想為什麼自己的電影不受歡迎,只需要通過網站瀏覽記錄數據分析觀眾最喜歡看什麼樣的電影就可以了。在大數據挖掘過程之中,單個數據可以作為垃圾被忽略,因為數據精準度是樣本化統計時代所追求的目標——一個信息缺乏的時代,「收集信息的有限意味著細微的錯誤會被放大,甚至有可能影響整個結果的准確性」(11)。隨著數據的大幅增加,為了了解大致發展趨勢而放棄精確性,可以接受適量錯誤。就像醫用燈,從一個角度打的光,不管亮度多高,仍然有暗區。而大數據的多維度屬性就像無影燈,從各個角度照射,就算其中一盞燈亮度不強,也不影響總體效果。在這個意義上大數據更加追求數據完整性和混雜性。
⑥ 電影票房預測系統的BRP(電影票房量化分析系統)的三大特點
BRP系統每周總票房的范圍預測法通過自適應分類,可根據電影知識庫中各周電影票房分布進行票房等級分類,使每周預測的票房范圍更為精確,縮小預測范圍。同時,其最終估值范圍通過波動性提示並衡量了相關風險的存在。這對於投資製片方進行有針對性的風險度量、風險管理及防範都具有重要意義。由於電影產業影響票房業績的變數眾多,蘊含復雜的系統及非系統風險,BRP系統能將之定量化並確定總體風險收益規模,無論對於即期電影發行,還是後續衍生開發,都具有重要的指導性。
⑦ 那些92年的「中年人」和80後「空巢老人」都喜歡看什麼電視劇
4月17日,在經歷了白百合事件之後,《外科風雲》按期在北京衛視和浙江衛視黃金檔首播了,並沒有受到影響調檔或下架。同一天首播的還有鹿晗和古力娜扎主演的古裝玄幻劇《擇天記》。
一部現實主義都市劇,一部玄幻題材古裝劇,一部實力演員擔綱,一部新生代偶像挑大樑,同天上映的兩部電視劇,不管在收視率、主演還是題材上,都被許多媒體拿來做比較。
《擇天記》首播當天收視破1,這樣的成績在湖南衛視的次黃檔還是不錯的,但《外科風雲》成績卻不盡人意。百曉生認為兩劇的收視率是沒有可比性的,兩劇的播出時段不同,《外科風雲》是頂著超級爆款《人民的名義》的巨大壓力,在黃金時段播出。《人民的名義》收視率勢不可擋地一路飆升突破,4月18日單集收視破5,該劇所在檔期也被稱為「死亡檔期」,《白鹿原》都「為取得更好的播出效果」而「擇機播出」了,《外科風雲》在這個時間播出,收視率必定受到影響。
(數據來源:小土科技影視大數據量化分析系統)
拋開「出軌事件」主角白百合不說,老幹部靳東和小鮮肉鹿晗可以說是這兩部劇的流量擔當了,再加上都市、古裝這兩大熱門類型和劇集所表達的思想內核,兩部劇都得到了觀眾的肯定。現實主義題材的都市劇無論在數量還是收視率上一直以來都是國產電視劇最大的熱門,近幾年市場上涌現出了多部優秀的作品,像《歡樂頌》《小別離》《好先生》《中國式關系》等,貼近生活反應現實的情節故事使觀眾產生強烈共鳴。相比之下,玄幻題材多改編自小說、游戲等,劇集本身就自帶一批活躍於網路文學的年輕粉絲,加之題材本身天馬行空的故事和年輕偶像的演繹,更加吸引了年輕受眾。
如今的電視劇市場,得年輕人者得天下,年輕人也是視頻網站的主要受眾,那麼將年輕人曾經熱愛的網路文學搬到台前,應該也是大受歡迎的,這也是近幾年玄幻題材火熱的原因之一。
2011年-2017年都市、玄幻題材電視劇走勢
(數據來源:小土科技影視大數據量化分析系統)
當下,在很多製作公司都開始把目光放在討好00後群體時,那麼已經被聯合國定義為中年人的90後和更多自嘲為80後空巢老人們的觀眾群們更關注哪些題材呢?
他們是站在年輕的尾巴上,還是已經而立老成了呢?
有人說,玄幻就是當代年輕人的「現實主義」,那麼80、90後對玄幻題材和現實主義接受度如何呢?
都市、玄幻題材電視劇受眾年齡分布
(數據來源:小土科技影視大數據量化分析系統)
從兩題材的受眾年齡分布來看,25-34歲受眾的佔比分別為都市題材21.43%,玄幻題材21.81%,並沒有明顯的差距。這是不是說明,題材對80後、90後受眾的收視選擇影響並不大呢?
我們從兩類題材中分別選取一部具有代表性的電視劇,對其受眾的年齡、性別、收入、學歷進行比較。現實主義以正在熱播的《人民的名義》為例,玄幻題材則選擇了《三生三世十里桃花》。
《人民的名義》與《三生三世十里桃花》受眾分析
(數據來源:小土科技影視大數據量化分析系統)
從受眾統計數據中看出,兩劇的觀眾分布基本一致,只在性別分布上有明顯差異,《三生三世》講述了青丘帝姬白淺和九重天太子夜華經歷三段愛恨糾葛終成眷屬的絕美仙戀故事,因而更受女性觀眾青睞。而且兩部劇在微博上的話題討論量也十分接近。
電視劇所面對的年輕觀眾,是一個熱愛並活躍於社交媒體,時刻關注熱點話題和社會問題的群體,他們對電視劇的選擇,不再是沒有想法照單全收,也不會整日沉迷於不真實的世界來逃避現實。80後 90後都開始更加關注社會的種種現象和問題,並且對現實生活有著自己的憧憬和思考。對於玄幻題材的喜愛,反應了他們對理想生活、命運、愛情的美好憧憬和嚮往,就像許多女性觀眾在看《三生三世》的時候,對白淺和夜華的愛情故事產生了共鳴,他們或許未婚,或許結婚,但這並不影響他們對美好事物的嚮往。
而《人民的名義》這種主旋律電視劇受到年輕人甚至是青少年的推崇,既是個意外,又折射出當下年輕人對社會現象和問題的關注。甚至連主演張豐毅都表示,對於很多90後的觀眾竟然也喜歡這部劇表示很驚訝!
劇中宣揚的愛憎分明、嫉惡如仇的正能量以及其關注現實、直截了當的劇情,恰恰與當代年輕人的氣質與觀念不謀而合。而達康書記系列表情包的躥紅和彈幕的火爆,正說明了這個角色形象在年輕人當中的受歡迎程度。表情包和彈幕已經成為時下年輕人表達體系非常重要的一部分,一言不合就扔達康書記表情包,又見吳剛的演技炸裂。
所以可見,這種現實主義題材在80、90後群體中的接受度非常之高。
結語:
當電視劇製作方和播出平台都已經開始准備討好00後的時候,80後和90後無論從思想、審美標准還是接受能力上,都已經相對成熟,這個群體正在成為既年輕又成熟的觀眾。曾經被無數次斷言垮掉的一代們,逐漸撕掉了外界貼在他們身上「膚淺」「墮落」「沒有追求」的標簽,如今都有著自己獨特的思考角度和審美標准。他們希望看到的不僅是具備討論熱度的電視劇,也希望看到深度接近現實的題材。
小土科技憑借資深的行業背景,多年積累的歷史數據,經驗豐富的技術團隊, 精心研發面向影視文化產業的雲服務平台,為各環節提供了專業的大數據解決方案,包括劇本/成片評估、收視預測、製片管理、數據分析等。 作為國內領先的影視行業大數據服務商,小土科技正逐步搭建涵蓋電視平台, 廣告投放,電影票房,完片擔保,融資信用評價等業務合作框架,推動科技,文化,金融產業融合,實現價值創新。
關注微博 @小土數據
關注微信:影視百曉生
⑧ 請告訴我ERP系統的相關知識
ERP,是「企業資源計劃」的英文縮寫
至於說ERP系統的操作,沒法回答,因為這是一種系統的類型,市面上有很多公司的品牌,主要說國內的吧,有用友、金蝶、路路通等,各家的軟體都不相同,所以沒法講解操作問題。
ERP相關知識涉及也非常廣,包括設計開發、實施應用,相關管理等等,相關知識寫成書可以用一家書店來裝,你的問題太泛,所以也沒法具體講,只能是你有個具體問題大家來幫忙解答
適用范圍就很廣了,基本上360行行行都能用,只要企業稍微有點規模。舉個例子,路路通的生產通在陶瓷行業,能幫助解決陶瓷的生產一系列流程問題,工資核算、業務規范等,這個講起來也是很費勁,我舉個具體細節例子吧。例如企業使用了我們路路通的生產通平台,老闆可以即時查看公司整體的業務進展,廠房主管可以直接在系統上查看庫存和訂單情況好根據情況下布產單,避免過多庫存,而業務員也能查看相關數據來決定是否有足夠庫存和生產能力來接下客戶的訂單。
好了,就說這么多吧,應該可以讓你有個大概的認識了,有了一些基本認識之後,下次就懂得如何根據具體問題來具體提問了。
⑨ 貓眼實時票房排行怎麼看
可以打開貓眼實時票房頁面進行查看。進入到該頁面以後,點擊電影票房。此時即可在該界面中看到對應電影實時的票房變動數據了。
貓眼專業版是由貓眼電影開發,為電影行業從業者提供及時、准確、專業的電影票房數據分析(秒級實時票房、排片和影院經營數據等),為影視從業者提供信息互通平台,提高影視作品製作效率(劇組成員招募,行業精英對接,找劇組、投資、導演、演員、攝影等)。
主要功能
電影營銷監控系統:電影營銷事件結合影片受眾畫像,有效量化營銷效果,准確定位影片受眾;
秒級實時票房:國內秒級實時票房查詢工具,每分每秒掌握電影市場實時動態;
找合作:海量劇組入駐,與劇組真實對接,雙方直接溝通合作意向,提高影視劇製作效率,業內精英工作檔期無縫銜接;
排片&上座率:國內最超前的排片查詢工具,提前一個月查詢熱門檔期排片,隨時掌握各影片排片場次及佔比,上座率及場均人次;
影院實時票房:更及時,更豐富,定位到影院!幫助影院經理知己知彼,更准確的制定經營決策。