2013-02-12 18 views
13

एक ट्विटर क्लाइंट युक्त आईओएस ऐप को विकसित करने में, मुझे उपयोगकर्ता द्वारा जेनरेट किए गए हैशटैग (जिसे ऐप के अंदर कहीं और बनाया जा सकता है, न केवल ट्वीट बॉडी में) की अनुमति देनी चाहिए।ट्विटर हैशटैग में कौन से पात्रों की अनुमति है?

मैं यह सुनिश्चित करना चाहता हूं कि ऐसे किसी भी हैशटैग ट्विटर के लिए मान्य हैं, इसलिए मैं अमान्य वर्णों के लिए दर्ज मान को जांचना चाहता हूं। ध्यान रखें कि उपयोगकर्ता गैर-अंग्रेजी भाषी देशों से हो सकते हैं।

मुझे सामान्य सीमाओं के बारे में पता है, जैसे किसी संख्या के साथ हैशटैग शुरू नहीं करना, और कोई विशेष विराम चिह्न नहीं, लेकिन मैं सोच रहा था कि क्या हैशटैग के भीतर तकनीकी रूप से अनुमति देने वाले सभी अतिरिक्त वर्णों की एक ज्ञात सूची है (यानी अंतरराष्ट्रीय पात्र)।

+1

मैं साइरिलिक की पुष्टि कर सकता हूं कि आप आसानी से रूसी में बहुत सारी ट्वीट्स पा सकते हैं जैसे https://twitter.com/search?q=%23%D0%BF%D1%80%D0%B8%D0% बी 2% डी 0% बी 5% डी 1% 82 और src = typd – Igor

उत्तर

0

ठीक है, शुरुआत के लिए आप हैशटैग (## हैश) में # का उपयोग नहीं कर सकते हैं।

नीचे दिए गए दिशानिर्देशों Twitter's help center से उद्धृत किया जा रहा है:

  • लोग उन ट्वीट्स श्रेणीबद्ध करने और उन्हें और अधिक आसानी से दिखाने में मदद करने वाला कोई प्रासंगिक कीवर्ड या उनके ट्वीट में वाक्यांश (कोई रिक्त स्थान) से पहले हैशटैग # का उपयोग ट्विटर में खोजें।
  • किसी भी संदेश में एक हैशटैग किए गए शब्द पर क्लिक करने से आपको उस कीवर्ड के साथ चिह्नित सभी अन्य ट्वीट दिखाए जाते हैं।
  • हैशटैग ट्वीट में कहीं भी हो सकता है - शुरुआत, मध्य या अंत में।
  • हैशटैग शब्द जो बहुत लोकप्रिय हो जाते हैं अक्सर ट्रेन्डिंग टॉपिक्स होते हैं।
    उदाहरण: नीचे दिए गए ट्वीट में, @eddie में हैशटैग # एफएफ शामिल था। उपयोगकर्ताओं ने इसे "शुक्रवार का पालन करें" के लिए शॉर्टेंड के रूप में बनाया, एक साप्ताहिक परंपरा जहां उपयोगकर्ता लोगों को सलाह देते हैं कि दूसरों को ट्विटर पर अनुसरण करना चाहिए। आप इसे शुक्रवार को देखेंगे। सही ढंग से

हैशटैग का उपयोग करना:

  • यदि आप किसी सार्वजनिक खाते पर एक हैशटैग के साथ ट्वीट करते हैं, तो किसी को जो कि हैशटैग खोज करने पर अपने ट्वीट मिल सकता है
  • # #spam न करें # हैशटैग के साथ। एक ट्वीट को ओवर-टैग न करें। (सर्वोत्तम अभ्यास प्रति ट्वीट 2 से अधिक हैशटैग का उपयोग करने की सलाह देते हैं।)
  • केवल विषय के लिए प्रासंगिक ट्वीट्स पर हैशटैग का उपयोग करें।
+2

प्रतिक्रिया के लिए धन्यवाद, हालांकि मुझे दिशानिर्देशों के बारे में पता है। मुझे हैशटैग में विदेशी पात्रों की अनुमति की एक निश्चित सूची नहीं मिल रही है। वैसे भी धन्यवाद। –

3

ट्विटर अक्षरों, संख्याओं और अंडरस्कोर की अनुमति देता है।

मैंने अपने एपीआई के माध्यम से ट्वीट्स उत्पन्न करके इसकी जांच की। उदाहरण के लिए, ट्वीट

हैश टैग परीक्षण #foo [बार

"#foo" में हुई एक हैश टैग के रूप में चिह्नित किया जा रहा है, और "[बार" होने अस्वरूपित पाठ।

+6

क्या आप कौन से पत्र स्पष्टीकरण दे सकते हैं? सुनिश्चित नहीं है कि क्या आपने अपना प्रश्न पूरी तरह से पढ़ा है, लेकिन मैं जानना चाहता हूं कि अंतरराष्ट्रीय पात्रों का समर्थन क्या है, यदि कोई हो। –

6

कार्ल, जैसा कि आपने सही तरीके से बताया है, किसी भी भाषा में कोई भी शब्द वैध ट्विटर हैशटैग (जब तक यह कई बुनियादी मानदंडों को पूरा करता है) हो सकता है। जैसा कि आप पूछ रहे हैं, वैध अंतर्राष्ट्रीय शब्द वर्णों की एक सूची है।मुझे यकीन है कि किसी ने ऐसी सूची को कहीं भी संकलित किया है, लेकिन इसका उपयोग करना आपके प्रारंभिक लक्ष्य के रूप में पहुंचने का सबसे प्रभावी तरीका नहीं होगा: यह सुनिश्चित करना कि एक दिया गया हैशटैग ट्विटर के लिए मान्य है।

मेरा मानना ​​है कि आप जो खोज रहे हैं वह एक नियमित अभिव्यक्ति है जो यूनिकोड रेंज के भीतर सभी शब्द वर्ण से मेल खा सकती है। ऐसी अभिव्यक्ति आपके लोकेल पर निर्भर नहीं होगी और आधुनिक टाइपोग्राफी के सभी पात्रों से मेल खाती है जो किसी शब्द के हिस्से के रूप में दिखाई दे सकती हैं।

आपने यह निर्दिष्ट नहीं किया है कि आप अपनी ऐप किस भाषा में लिख रहे हैं, इसलिए मैं भाषा विशिष्ट कार्यान्वयन में आपकी सहायता नहीं कर सकता। हालांकि, बुनियादी दृष्टिकोण के रूप में किया जाएगा इस प्रकार है:

  1. चेक अगर ब्रैकेट भाव या चरित्र वर्गों में से किसी को पहले से ही समर्थन यूनिकोड वर्ण अपनी भाषा में बीच है। यदि हां, तो उनका उपयोग करें।

  2. जांचें कि क्या रेगेक्स संशोधक है जो यूनिकोड वर्ण श्रेणी आपकी भाषा के लिए समर्थन सक्षम कर सकता है।

अधिकांश आधुनिक भाषाओं एक काफी समान तरीके से नियमित अभिव्यक्ति को लागू करने और उनमें से एक बहुत पर्ल से भारी उधार, इसलिए मुझे आशा है कि निम्न दो उदाहरण सही रास्ते पर डाल देगा:

पर्ल:

उपयोग POSIX ब्रैकेट भाव: (: \w जैसे) (जैसे [[:alpha:]], [[:allnum:]], [[:digit:]], आदि) वे तुम्हें पात्रों आप मिलान कराना चाहते पर अधिक नियंत्रण, चरित्र वर्गों के लिए तुलना देने के रूप में।

पैटर्न मिलान करते समय यूनिकोड समर्थन को सक्षम करने के लिए /u संशोधक का उपयोग करें। इस संशोधक के तहत, एएससीआईआई प्लेटफार्म प्रभावी रूप से यूनिकोड मंच बन जाता है; और इसलिए, उदाहरण के लिए, \w यूनिकोड में 100,000 से अधिक शब्द वर्णों से मेल खाएगा।

पर्ल देखें अधिक जानकारी के लिए प्रलेखन:

रूबी:

उपयोग POSIX ब्रैकेट भाव के रूप में वे गैर- ASCII वर्ण धरना। उदाहरण के लिए,/\ d/केवल ASCII दशमलव अंक (0-9) से मेल खाता है; जबकि/[[: अंक:]]/यूनिकोड एनडी श्रेणी में किसी भी चरित्र से मेल खाता है।

अधिक जानकारी के लिए

रूबी देखें प्रलेखन:

उदाहरण:

हैशटैग की एक सूची को देखते हुए, निम्नलिखित regex सभी हैशटैग कि एक शब्द के साथ शुरू से मेल खाएगी चरित्र (इंक।अंतरराष्ट्रीय शब्द अक्षर) और एक और शब्द चरित्र, एक नंबर या किसी अंडरस्कोर से पीछा कर रहे हैं:

m/^#[[:alpha:]][[:alnum:]_]+$/u  # Perl 

    /^#[[:alpha:]][[:alnum:]_]+$/  # Ruby 
-1

केवल अक्षर और संख्या एक हैशटैग का हिस्सा बनने की अनुमति है। यदि इनमें से कोई अन्य चरित्र अग्रणी # और एक अक्षर या संख्या का पालन करता है, तो इस बिंदु पर हैशटैग काट दिया जाएगा।

मैं अनुशंसा करता हूं कि आपका उपयोगकर्ता इंटरफ़ेस इनपुट फ़ील्ड के टेक्स्ट रंग को बदलकर उपयोगकर्ता को इंगित करे यदि उपयोगकर्ता किसी पत्र या संख्या के अलावा कुछ भी दर्ज करता है।

संबंधित मुद्दे