पर रैखिक प्रतिगमन के लिए फ़्लोट करने के लिए तारीख को कनवर्ट करें ऐसा लगता है कि ओएलएस रैखिक प्रतिगमन के लिए पांडस में अच्छी तरह से काम करने के लिए, तर्कों को तैरना चाहिए। मैं एक csv फार्म के ("gameAct.csv" कहा जाता है) के साथ शुरू कर रहा हूँ:पांडस डेटा फ्रेम
date, city, players, sales
2014-04-28,London,111,1091.28
2014-04-29,London,100,1100.44
2014-04-28,Paris,87,1001.33
...
मैं कैसे बिक्री की तारीख पर निर्भर की रेखीय प्रतीपगमन निष्पादित करना चाहते हैं (समय आगे बढ़ता है के रूप में, कैसे बिक्री के लिए कदम है?) । नीचे दिए गए मेरे कोड के साथ समस्या उन तारीखों के साथ प्रतीत होती है जो फ्लोट मान नहीं हैं। मैं पांडस में इस अनुक्रमण समस्या को हल करने के तरीके पर सहायता की सराहना करता हूं।
मेरे वर्तमान (गैर काम कर रहे है, लेकिन संकलन कोड):
import pandas as pd
from pandas import DataFrame, Series
import statsmodels.formula.api as sm
df = pd.read_csv('gameAct.csv')
df.columns = ['date', 'city', 'players', 'sales']
city_data = df[df['city'] == 'London']
result = sm.ols(formula = 'sales ~ date', data = city_data).fit()
मैं शहर मूल्य अलग-अलग रूप में, मैं आर^2 = 1 परिणाम प्राप्त है, जो गलत है। मैंने dataframe df
को परिभाषित करने में index_col = 0, parse_dates == True'
का भी प्रयास किया है, लेकिन सफलता के बिना।
मुझे संदेह है कि ऐसी सीएसवी फाइलों में तारीखों पर मूल प्रतिगमन करने के लिए और अधिक सामान्य समय श्रृंखला विश्लेषण के लिए पढ़ने का एक बेहतर तरीका है। सहायता, उदाहरण, और संसाधनों की सराहना की जाती है!
ध्यान दें, इसके बाद के संस्करण कोड के साथ, अगर मैं एक सरणी के लिए (किसी दिए गए शहर के लिए) दिनांक सूचकांक कनवर्ट करते हैं, इस सरणी में मानों के रूप में हैं:
'\xef\xbb\xbf2014-04-28'
कैसे एक एक AIC उत्पादन करता है सभी गैर-बिक्री मानकों पर विश्लेषण? (उदाहरण के लिए परिणाम यह हो सकता है कि बिक्री तिथि और शहर पर सबसे अधिक रैखिक रूप से निर्भर करती है)।
निश्चित रूप से, एक समाधान जो अवांछित और अनपैंडस जैसा है: datecol = london ['date']; londates = []; x में डेटकोल के लिए: londates.append (फ्लोट (एक्स।प्रतिस्थापित करें ('-', ''))) और फिर संदर्भ के लिए धन्यवाद londates सरणी – Quetzalcoatl