का उपयोग करते समय लंबे समय तक 'SENDING डेटा' स्थिति में रहना MySQL क्वेरी में क्वेरी है जो डेटा स्थिति बहुत लंबी अवधि के लिए भेज रही है। किसी ने मुझे इस के साथ मदद कृपया कर सकते हैं:LEFT JOIN

select a.msgId,a.senderId,a.destination,a.inTime,a.status as InStatus,b.status as SubStatus,c.deliverTime,substr(c.receipt,82,7) as DlvStatus 
from inserted_history a left join submitted_history b on b.msgId = a.msgId left join delivered_history c on a.msgId = c.msgId 
where a.inTime between '2010-08-10 00:00:00' and '2010-08-010 23:59:59' and a.systemId='ND_arber' 

delivered_history में कुल अभिलेख:

inserted_history में कुल रिकॉर्ड:

नीचे दिए गए विवरण

MySQL क्वेरी हैं

में कुल रिकॉर्ड:

के बारे में बताएं क्वेरी:

id , select_type , table , type , possible_keys , key , key_len , ref , rows , Extra 
    1 , SIMPLE , a , ref , systemId,idx_time , systemId , 14 , const , 735310 , Using where 
    1 , SIMPLE , b , ref , PRIMARY , PRIMARY , 66 , gwreports2.a.msgId , 2270405 ,  
    1 , SIMPLE , c , ref , PRIMARY , PRIMARY , 66 , gwreports2.a.msgId , 2238701 , 


CREATE TABLE `delivered_history` (
`msgId` VARCHAR(64) NOT NULL, 
`systemId` VARCHAR(12) NOT NULL, 
`deliverTime` TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00', 
`smscId` VARCHAR(64) NOT NULL, 
`smsc` VARCHAR(20) NOT NULL, 
`receipt` BLOB NULL, 
`errcode` INT(11) NULL DEFAULT NULL, 
PRIMARY KEY (`msgId`, `deliverTime`), 
INDEX `systemId` (`systemId`), 
INDEX `smsc` (`smsc`), 
INDEX `idx_time` (`deliverTime`) 

के लिए टेबल बनाएं inserted_history

के लिए टेबल बनाएं
CREATE TABLE `inserted_history` (
`msgId` VARCHAR(64) NOT NULL, 
`systemId` VARCHAR(12) NOT NULL, 
`senderId` VARCHAR(15) NOT NULL, 
`destination` VARCHAR(15) NOT NULL, 
`inTime` TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00', 
`status` VARCHAR(20) NOT NULL, 
`msgText` BLOB NULL, 
PRIMARY KEY (`msgId`, `inTime`), 
INDEX `systemId` (`systemId`), 
INDEX `senderId` (`senderId`), 
INDEX `destination` (`destination`), 
INDEX `status` (`status`), 
INDEX `idx_time` (`inTime`) 


CREATE TABLE `submitted_history` (
`msgId` VARCHAR(64) NOT NULL, 
`systemId` VARCHAR(12) NOT NULL, 
`submitTime` TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00', 
`status` VARCHAR(20) NOT NULL, 
`smscId` VARCHAR(64) NOT NULL, 
`smsc` VARCHAR(16) NOT NULL, 
`errcode` INT(6) NULL DEFAULT '0', 
PRIMARY KEY (`msgId`, `submitTime`), 
INDEX `systemId` (`systemId`), 
INDEX `smsc` (`smsc`), 
INDEX `status` (`status`), 
INDEX `idx_time` (`submitTime`) 

के लिए टेबल बनाएं सभी तालिकाओं को DATE टाइमस्टैम्प क्षेत्रों पर partioned

में वैश्विक चर की सूची को छानने करता है टा में शामिल हो गए ब्लेस क्वेरी को तेज करने में मदद करते हैं?


मुख्य विचार

आप InnoDB का उपयोग कर रहे हैं? ऐसा लगता है कि आपका बफर पूल केवल 8 एमबी है। यह आसानी से समस्या हो सकती है, आप बहुत सारे डेटा से निपट रहे हैं और इनो डीबी में ज्यादा मेमोरी नहीं है। क्या आप innodb_buffer_pool_size को टक्कर दे सकते हैं? आपको MySQL को पुनरारंभ करना होगा, लेकिन मैं शर्त लगा रहा हूं कि इससे बड़ा अंतर आएगा, भले ही आप इसे केवल 256 या 512 एमबी दें।

अपडेट: मुझे लगता है कि आपका स्टोरेज इंजन और टेबल प्रारूप माईसाम में डिफ़ॉल्ट रूप से प्रतीत होता है, इसलिए जब तक कि आप अन्यथा निर्दिष्ट नहीं करते हैं, यह लागू नहीं होगा। मुझे आश्चर्य है कि myisam_sort_buffer_size मदद करेगा? हम माईसाम का उपयोग नहीं करते हैं इसलिए मैं इसे ट्यून करने से परिचित नहीं हूं।

रैंडम सोचा

मुझे आश्चर्य है कि प्राथमिक कुंजी होने अल्फान्यूमेरिक होना (विशेष रूप से VARCHAR) यह से कोई लेना देना है या नहीं। मुझे याद है कि हमें गैर-संख्यात्मक प्राथमिक कुंजी पर प्रदर्शन के साथ समस्याएं थीं, लेकिन वह डेटाबेस 4.0 या 4.1 से दिनांकित था, ताकि लागू न हो (या कभी भी सच हो)।

माध्यमिक आइडिया

ऊपर स्मृति बात करने के बाद, मेरे सबसे अच्छे अनुमान MySQL अधिक संकेत देने के लिए किया जाएगा। जब मेरे पास एक क्वेरी है जो धीमी गति से चल रही है, तो मुझे अक्सर यह अधिक जानकारी देने में मदद मिलती है। आपके पास प्रत्येक तालिका पर संदेश आईडी/टाइम इंडेक्स है। हो सकता है कि इस तरह से अधिक कुछ बेहतर काम करेगा: आप बेहतर सीमा है, तो

select a.msgId,a.senderId,a.destination,a.inTime,a.status as InStatus, 
b.status as SubStatus,c.deliverTime,substr(c.receipt,82,7) as DlvStatus 
from inserted_history a left join submitted_history b on b.msgId = a.msgId 
left join delivered_history c on a.msgId = c.msgId 
where a.inTime between '2010-08-10 00:00:00' and '2010-08-010 23:59:59' 
and a.systemId='ND_arber' AND c.inTime between b.inTime >= a.inTime 
and c.inTime >= b.inTime 

मैं चीजों को अनुमान लगा रहा हूँ एक है, तो बी, तो सी में डाला हो (जैसे कि जब कुछ एक में चला जाता है, यह हमेशा बाहर भेज दिया जाता है और एक दिन के भीतर जमा) उस जानकारी को मदद कर सकते हैं।

मुझे इस बारे में आश्चर्य है क्योंकि मैंने इसे कुछ स्थितियों में अपने क्वेरी प्रदर्शन में मदद की है, लेकिन यह भी कि आपके पास डेटाटाइम पर डेटा विभाजित है। यह अनुकूलक की मदद कर सकता है।

मेरा अन्य सुझाव आपकी क्वेरी को थोड़े समय के लिए चलाने के लिए होगा, पूरे दिन के बजाय 10 मिनट कहें, और सुनिश्चित करें कि परिणाम सही हैं। फिर 30 कोशिश करें। इसे बढ़ाएं और देखें कि यह "कल वापस आना" क्षेत्र में कब गिरता है। यह आपको कुछ बता सकता है।


यह inserted_history के सूचकांक,

systemid (systemid) को बदलने के लिए संभव है

systemid (systemid, Intime) किया जाना है। या एक अतिरिक्त इंडेक्स

मेरा तर्क यह है कि इससे सम्मिलित_हैतिहासिक (ए) पंक्तियों के चयन को तेज़ी से बढ़ाने में मदद मिलनी चाहिए जो शामिल होने का आधार बनती हैं।

जहां खंड "जहां" 2010-08-10 00:00:00 'और' 2010-08-010 23:59:59 'और'.simestemId =' ND_arber '' के बीच a.inTime होगा सूचकांक द्वारा चयन योग्य। वर्तमान में, पंक्तियां सिस्टम आईडी द्वारा चयन योग्य हैं लेकिन फिर उन सभी पंक्तियों को उस समय स्कैन करने की आवश्यकता है।

बस ब्याज की बात के रूप में, प्रत्येक सिस्टम आईडी के लिए कितने रिकॉर्ड (औसत पर) होंगे। इसके अलावा, अपने आप पर अद्वितीय नहीं है, फिर भी अन्य तालिकाओं में कितने रिकॉर्ड (औसत पर) होगा।


आपका समझाने योजना है कि आप दिया:

id , select_type , table , type , possible_keys  , key  , key_len , ref     , rows , Extra 
1 , SIMPLE  , a  , ref , systemId idx_time) , systemId , 14  , const    , 735310 , Using where 
1 , SIMPLE  , b  , ref , PRIMARY   , PRIMARY , 66  , gwreports2.a.msgId , 2270405 , 
1 , SIMPLE  , c  , ref , PRIMARY   , PRIMARY , 66  , gwreports2.a.msgId , 2238701 , 

से पता चलता है कि आप मार रहे हैं: 735310 * 2270405 * 2238701 = 3T पंक्तियों !!!!!! प्रभावी रूप से आप अपनी अनुक्रमणिका को अपनी पूरी क्षमता में उपयोग नहीं कर रहे हैं।

अपनी 'व्याख्या योजना' की व्याख्या कैसे करें: तालिका 'ए' (735310) में प्रत्येक पंक्ति के लिए, आप तालिका 'बी' 2270405 बार हिट करते हैं। तालिका 'बी' में हर पंक्ति के लिए आप टेबल 'सी' 2238701 बार हिट करते हैं। जैसा कि आप देख सकते हैं, यह एक घातीय समस्या है।

हां, 8 एमबी इनो डीबी बफर स्पेस छोटा है, लेकिन आपकी व्याख्या योजना को xxxx * 1 * 1 तक प्राप्त करने के परिणामस्वरूप अविश्वसनीय गति होगी, भले ही 8 एमबी बफर स्पेस के लिए।

SELECT a.msgId,a.senderId,a.destination,a.inTime,a.status as InStatus,b.status as SubStatus,c.deliverTime,substr(c.receipt,82,7) as DlvStatus 
    FROM inserted_history a 
    LEFT JOIN submitted_history b ON b.msgId = a.msgId -- USES 1 column of PK 
    LEFT JOIN delivered_history c ON a.msgId = c.msgId -- USES 1 column of PK 
WHERE a.inTime BETWEEN '2010-08-10 00:00:00' AND '2010-08-010 23:59:59' -- NO key 
    AND a.systemId='ND_arber' -- Uses non-unique PK 

यहाँ मैं देख रहा हूँ समस्याएं हैं:

आपकी क्वेरी को देखते हुए ए) आपका _history तालिकाएं 'टाइमस्टैम्प' डेटाप्रकार साथ स्तंभों पर विभाजित हैं, अभी तक आप अपने में शामिल हों/कहां में उन स्तंभों नहीं हैं मानदंड। इंजन को उस जानकारी के बिना हर विभाजन को हिट करना होगा। बी) submit_history तक पहुंच और delivery_history 2-कॉलम पीके के केवल 1 कॉलम का उपयोग कर रहा है। आपको केवल पीके का आंशिक लाभ मिल रहा है। क्या आप जॉइन का हिस्सा बनने के लिए और कॉलम प्राप्त कर सकते हैं? आपको इस तालिका के लिए जितनी संभव हो सके '1' के करीब पाए गए पंक्तियों में से # प्राप्त करना होगा।
सी) msgId = varchar (64) और इस हर तालिका के लिए पी के 1 स्तंभ है। प्रत्येक मेज पर अपनी चाबी ** हैं विशाल ** !!
- पी के लिए कॉलम के आकार को कम, या विभिन्न स्तंभों का उपयोग करने का प्रयास करें।

आपका डेटा अन्य चाबियों का पैटर्न से पता चलता आप गैर पी कुंजी में करार डिस्क/राम अंतरिक्ष की बहुत सारी है।

प्रश्न 1) क्या टेबल रिपोर्ट से प्रत्येक के लिए "इंडेक्स शो से" (Link) करता है ?? कॉलम 'कार्डिनलिटी' आपको दिखाएगा कि आपकी प्रत्येक कुंजी वास्तव में कितनी प्रभावी है। कार्डिनालिटी जितनी छोटी है, सूचकांक सबसे कम/कम प्रभावी है। आदर्श प्रदर्शन के लिए आप जितनी संभव हो सके "कुल पंक्तियों" के करीब कार्डिनिटी चाहते हैं।

प्रश्न 2) क्या आप एसक्यूएल को फिर से कारक बना सकते हैं जैसे कि प्रत्येक तालिका के जॉइनड कॉलम उस तालिका के लिए उच्चतम कार्डिनिटी वाले हैं?

प्रश्न 3) क्या 'टाइमस्टैम्प' डेटामैप के कॉलम वास्तव में विभाजन के लिए सबसे अच्छा कॉलम है? यदि आपके एक्सेस पैटर्न हमेशा 'msgId' का उपयोग करते हैं, और msgstr "पीडी का पहला स्तंभ है, तो।

प्रश्न 4) msgId अद्वितीय है? मेरा अनुमान हाँ है, और पीके का दूसरा कॉलम वास्तव में आवश्यक नहीं है।

एसक्यूएल (Link) अनुकूलित करने पर पढ़ें और अपनी टेबल की इंडेक्स कार्डिनिटी रिपोर्ट करें। क्वेरी को अनुकूलित करने का तरीका जानने का यह तरीका है। आप को समझाने की योजना का 'पंक्तियों' होना चाहते हैं एन * 1 * 1.

साइड नोट: InnoDB & MyISAM इंजन नहीं स्वचालित रूप से गैर-अद्वितीय स्तंभों के लिए तालिका प्रमुखता अद्यतन करता है, डीबीए मैन्युअल 'चलाने के लिए टेबल विश्लेषण की जरूरत है समय-समय पर इसकी सटीकता सुनिश्चित करने के लिए।

गुड लक।

