आर

2011-06-01 9 views
5

में ज़िप कोड जनसांख्यिकी मैं अपने लक्ष्यों को "लंबा रास्ता" प्राप्त कर सकता हूं लेकिन आर के भीतर पूरी तरह से रहने की उम्मीद कर रहा हूं। मैं अपने डेटाबेस में रिकॉर्ड करने के लिए ज़िप कोड द्वारा जनगणना जनसांख्यिकीय डेटा को जोड़ना चाहता हूं। मुझे पता है कि आर में कुछ जनगणना आधारित पैकेज हैं, लेकिन, जब तक कि मुझे कुछ याद नहीं आ रहा है, ये डेटा ज़िप कोड स्तर पर मौजूद नहीं हैं, और न ही मौजूदा डेटा फ्रेम पर विलय करना सहज है।आर

संक्षेप में, क्या यह आर के भीतर ऐसा करना संभव है, या कहीं और डेटा को पकड़ने और आर में पढ़ने के लिए मेरा सबसे अच्छा तरीका है?

किसी भी मदद की सराहना की जाएगी!

उत्तर

6

संक्षेप में, नहीं। ज़िप अनुवादों की जनगणना आम तौर पर स्वामित्व स्रोतों से बनाई जाती है।

यह संभावना नहीं है कि आपको जनगणना के परिप्रेक्ष्य (गोपनीयता) से ज़िप कोड में कुछ भी मिलेगा। हालांकि, इसका मतलब यह नहीं है कि आप ठंड में छोड़े गए हैं। आप अपने पास जो ज़िपकोड्स का उपयोग कर सकते हैं और एमएसए, एमयूएसए या सीएसए स्तर से जनगणना डेटा जोड़ सकते हैं। अब आपको बस अपने एमएसए, एमयूएसए या सीएसए के भीतर पोस्टल कोड की एक सूची है ताकि आप विलय कर सकें। ऑनलाइन एक गुच्छा है जो बहुत सस्ता है यदि आपके पास पहले से ऐसी सूची नहीं है।

उदाहरण के लिए, कनाडा में, हम एफएसए स्तर पर सीआरए से आय डेटा प्राप्त कर सकते हैं (फॉर्म ए 1 ए 1 ए 1 में डाक कोड के पहले तीन अंक)। मुझे यकीन नहीं है कि आईआरएस समान जानकारी प्रदान करता है या नहीं, मैं अमेरिकी जनगणना डेटा से भी परिचित नहीं हूं, लेकिन मुझे लगता है कि वे सीएसए स्तर पर कम से कम जानकारी प्रदान करते हैं।

आप इन सभी acronyms भ्रमित कर रहे हैं:

  1. एमएसए: http://en.wikipedia.org/wiki/Metropolitan_Statistical_Area
  2. सीएसए: http://en.wikipedia.org/wiki/Combined_statistical_area
  3. मूसा: http://en.wikipedia.org/wiki/Micropolitan_Statistical_Area
+0

हालांकि, किसी को एक गैर मालिकाना ज़िप एमएसए सूची के जानता है कि अगर मैं था इसे देखने से खुश रहो। –

+0

जनगणना ब्यूरो यह कहना पसंद करता है कि "हम ज़िप कोड नहीं छूते हैं, हमसे मत पूछें", लेकिन बहुत नीचे नीचे http://www.census.gov/population/www/metroareas/metroarea.html देखें सीबीएसए (मेट्रो + माइक्रो सांख्यिकीय क्षेत्रों) को ज़िप कोड का मैपिंग है, हालांकि कुछ साल पुराना है। यद्यपि यह अभी भी नरक के रूप में गन्दा है, क्योंकि वहां ऐसी सीमाएं नहीं हैं जिनमें ज़ीप्स सीधे एमएसए को मैप करते हैं, लेकिन यह एक शुरुआत है। आह, जब मैं जीवित रहने के लिए इस के साथ मकड़ी करता था, तो यादगार यादें ... – Noah

0

आपका सबसे अच्छा शर्त U.S. Census Bureau TIGER/Line shapefiles साथ शायद है। उनके पास 2010 के लिए राज्य स्तर पर ज़िप कोड सारणीकरण क्षेत्र आकार (ZCTA5) है जो आपके उद्देश्यों के लिए पर्याप्त हो सकता है।

जनगणना डेटा स्वयं American FactFinder पर पाया जा सकता है। उदाहरण के लिए, आप उप-काउंटी स्तर (यानी शहर/शहर) में आबादी के अनुमान प्राप्त कर सकते हैं, लेकिन ज़िप-कोड स्तर पर सीधे-आगे जनसंख्या अनुमान नहीं लगा सकते हैं। मुझे आपके डेटा सेट के विवरण नहीं पता हैं, लेकिन एक समाधान के लिए रिश्ते तालिकाओं के उपयोग की आवश्यकता हो सकती है जो कि टाइगर/लाइन डेटा के हिस्से के रूप में भी उपलब्ध हैं, या वैकल्पिक रूप से जनगणना डेटा (उप-गणना आकारफाइल) वाले स्थान नामों में शामिल हो रहे हैं। ZCTA5 कोड के साथ।

मेटाडेटा से नोट: "ये उत्पाद किसी उत्पाद या प्रकाशन में उपयोग करने के लिए स्वतंत्र हैं, हालांकि स्रोत के रूप में अमेरिकी जनगणना ब्यूरो को पावती दी जानी चाहिए।"

HTH

0

मैं सिर्फ एक आर पैकेज totalcensus (https://github.com/GL-Li/totalcensus) कहा जाता है, जिसके साथ आप आसानी से दस वर्ष की जनगणना और एसीएस सर्वेक्षण में कोई भी डेटा निकाल सकते हैं लिखा था।

यदि आप अभी भी परवाह करते हैं तो इस पुराने प्रश्न के लिए, आप कुल आबादी (डिफ़ॉल्ट रूप से) और दशकों की जनगणना 2010 या 2015 एसीएस 5-वर्ष सर्वेक्षण के राष्ट्रीय डेटा से अन्य जातियों की आबादी प्राप्त कर सकते हैं।

2015 से एसीएस 5-वर्षीय सर्वेक्षण।download_census("decennial", 2010, "US") साथ

zip_acs5 <- read_acs5year(
    year = 2015, 
    states = "US", 
    geo_headers = "ZCTA5", 
    table_contents = c(
     "white = B02001_002", 
     "black = B02001_003", 
     "asian = B02001_005" 
    ), 
    summary_level = "860" 
) 

#    GEOID  lon  lat ZCTA5 state population white black asian GEOCOMP SUMLEV  NAME 
#  1: 86000US01001 -72.62827 42.06233 01001 NA  17438 16014 230 639  all 860 ZCTA5 01001 
#  2: 86000US01002 -72.45851 42.36398 01002 NA  29780 23333 1399 3853  all 860 ZCTA5 01002 
#  3: 86000US01003 -72.52411 42.38994 01003 NA  11241 8967 699 1266  all 860 ZCTA5 01003 
#  4: 86000US01005 -72.10660 42.41885 01005 NA  5201 5062 40 81  all 860 ZCTA5 01005 
#  5: 86000US01007 -72.40047 42.27901 01007 NA  14838 14086 104 330  all 860 ZCTA5 01007 
# ---                          
# 32985: 86000US99923 -130.04103 56.00232 99923 NA   13 13  0  0  all 860 ZCTA5 99923 
# 32986: 86000US99925 -132.94593 55.55020 99925 NA  826 368  7  0  all 860 ZCTA5 99925 
# 32987: 86000US99926 -131.47074 55.13807 99926 NA  1711 141  0  2  all 860 ZCTA5 99926 
# 32988: 86000US99927 -133.45792 56.23906 99927 NA  123 114  0  0  all 860 ZCTA5 99927 
# 32989: 86000US99929 -131.60683 56.41383 99929 NA  2365 1643  5 60  all 860 ZCTA5 99929 

जनगणना से 2010 डाउनलोड राष्ट्रीय डेटा और उसके बाद: download_census("acs5year", 2015, "US") साथ राष्ट्रीय डेटा डाउनलोड करें और उसके बाद

zip_2010 <- read_decennial(
    year = 2010, 
    states = "US", 
    table_contents = c(
     "white = P0030002", 
     "black = P0030003", 
     "asian = P0030005" 
    ), 
    geo_headers = "ZCTA5", 
    summary_level = "860" 
) 

#    lon  lat ZCTA5 state population white black asian GEOCOMP SUMLEV 
#  1: -66.74996 18.18056 00601 NA  18570 17285 572  5  all 860 
#  2: -67.17613 18.36227 00602 NA  41520 35980 2210 22  all 860 
#  3: -67.11989 18.45518 00603 NA  54689 45348 4141 85  all 860 
#  4: -66.93291 18.15835 00606 NA  6615 5883 314  3  all 860 
#  5: -67.12587 18.29096 00610 NA  29016 23796 2083 37  all 860 
# ---                    
# 33116: -130.04103 56.00232 99923 NA   87 79  0  0  all 860 
# 33117: -132.94593 55.55020 99925 NA  819 350  2  4  all 860 
# 33118: -131.47074 55.13807 99926 NA  1460 145  6  2  all 860 
# 33119: -133.45792 56.23906 99927 NA   94 74  0  0  all 860 
# 33120: -131.60683 56.41383 99929 NA  2338 1691  3 33  all 860