ഉള്ളടക്കം
ഒരു PDF ഫയലിലെ ഒരു സ്പ്രെഡ്ഷീറ്റിൽ നിന്ന് Microsoft Excel ഷീറ്റിലേക്ക് ഡാറ്റ കൈമാറ്റം ചെയ്യുന്നതിനുള്ള ചുമതല എല്ലായ്പ്പോഴും "രസകരമാണ്". നിങ്ങൾക്ക് FineReader പോലെയുള്ള വിലയേറിയ തിരിച്ചറിയൽ സോഫ്റ്റ്വെയർ അല്ലെങ്കിൽ അതുപോലുള്ള മറ്റെന്തെങ്കിലും ഇല്ലെങ്കിൽ പ്രത്യേകിച്ചും. നേരിട്ട് പകർത്തുന്നത് സാധാരണയായി നല്ലതിലേക്ക് നയിക്കില്ല, കാരണം. പകർത്തിയ ഡാറ്റ ഷീറ്റിലേക്ക് ഒട്ടിച്ചതിന് ശേഷം, അവ മിക്കവാറും ഒരു നിരയിലേക്ക് "ഒന്നിച്ചുനിൽക്കും". അതിനാൽ അവ ഒരു ഉപകരണം ഉപയോഗിച്ച് കഠിനമായി വേർപെടുത്തേണ്ടിവരും നിരകൾ പ്രകാരമുള്ള വാചകം ടാബിൽ നിന്ന് ഡാറ്റ (ഡാറ്റ - നിരകളിലേക്കുള്ള വാചകം).
തീർച്ചയായും, ഒരു ടെക്സ്റ്റ് ലെയർ ഉള്ള PDF ഫയലുകൾക്ക് മാത്രമേ പകർത്താൻ കഴിയൂ, അതായത് പേപ്പറിൽ നിന്ന് PDF-ലേക്ക് സ്കാൻ ചെയ്ത ഒരു പ്രമാണം ഉപയോഗിച്ച്, ഇത് തത്വത്തിൽ പ്രവർത്തിക്കില്ല.
പക്ഷെ അത് അത്ര സങ്കടകരമല്ല, ശരിക്കും 🙂
നിങ്ങൾക്ക് ഓഫീസ് 2013 അല്ലെങ്കിൽ 2016 ഉണ്ടെങ്കിൽ, കുറച്ച് മിനിറ്റിനുള്ളിൽ, അധിക പ്രോഗ്രാമുകൾ ഇല്ലാതെ, PDF-ൽ നിന്ന് Microsoft Excel-ലേക്ക് ഡാറ്റ കൈമാറുന്നത് തികച്ചും സാദ്ധ്യമാണ്. കൂടാതെ Word, Power Query എന്നിവ ഇതിൽ നമ്മെ സഹായിക്കും.
ഉദാഹരണത്തിന്, യൂറോപ്പിനായുള്ള സാമ്പത്തിക കമ്മീഷന്റെ വെബ്സൈറ്റിൽ നിന്നുള്ള ഒരു കൂട്ടം ടെക്സ്റ്റ്, ഫോർമുലകൾ, ടേബിളുകൾ എന്നിവ ഉപയോഗിച്ച് ഈ PDF റിപ്പോർട്ട് എടുക്കാം:
… കൂടാതെ Excel-ൽ നിന്ന് പുറത്തെടുക്കാൻ ശ്രമിക്കുക, ആദ്യ പട്ടിക പറയുക:
നമുക്ക് പോകാം!
ഘട്ടം 1. Word-ൽ PDF തുറക്കുക
ചില കാരണങ്ങളാൽ, കുറച്ച് ആളുകൾക്ക് അറിയാം, എന്നാൽ 2013 മുതൽ മൈക്രോസോഫ്റ്റ് വേഡ് PDF ഫയലുകൾ തുറക്കാനും തിരിച്ചറിയാനും പഠിച്ചു (സ്കാൻ ചെയ്തവ പോലും, അതായത്, ഒരു ടെക്സ്റ്റ് ലെയർ ഇല്ലാതെ!). ഇത് തികച്ചും സ്റ്റാൻഡേർഡ് രീതിയിലാണ് ചെയ്യുന്നത്: ഓപ്പൺ വേഡ്, ക്ലിക്ക് ചെയ്യുക ഫയൽ - തുറക്കുക (ഫയൽ - തുറക്കുക) വിൻഡോയുടെ താഴെ വലത് കോണിലുള്ള ഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റിൽ PDF ഫോർമാറ്റ് വ്യക്തമാക്കുക.
അതിനുശേഷം നമുക്ക് ആവശ്യമുള്ള PDF ഫയൽ തിരഞ്ഞെടുത്ത് ക്ലിക്കുചെയ്യുക തുറക്കുക (തുറക്കുക). ഈ ഡോക്യുമെന്റിൽ OCR ടെക്സ്റ്റിലേക്ക് പ്രവർത്തിപ്പിക്കാൻ പോകുന്നുവെന്ന് വേഡ് നമ്മോട് പറയുന്നു:
ഞങ്ങൾ സമ്മതിക്കുന്നു, കുറച്ച് നിമിഷങ്ങൾക്കുള്ളിൽ Word-ൽ ഇതിനകം തന്നെ എഡിറ്റ് ചെയ്യുന്നതിനായി ഞങ്ങളുടെ PDF തുറന്ന് കാണും:
തീർച്ചയായും, ഡിസൈൻ, ശൈലികൾ, ഫോണ്ടുകൾ, തലക്കെട്ടുകൾ, അടിക്കുറിപ്പുകൾ മുതലായവ ഡോക്യുമെന്റിൽ നിന്ന് ഭാഗികമായി പറക്കും, പക്ഷേ ഇത് ഞങ്ങൾക്ക് പ്രധാനമല്ല - ഞങ്ങൾക്ക് പട്ടികകളിൽ നിന്നുള്ള ഡാറ്റ മാത്രമേ ആവശ്യമുള്ളൂ. തത്വത്തിൽ, ഈ ഘട്ടത്തിൽ, അംഗീകൃത പ്രമാണത്തിൽ നിന്ന് ടേബിൾ Word ലേക്ക് പകർത്തി Excel-ൽ ഒട്ടിക്കാൻ ഇത് ഇതിനകം പ്രലോഭനമാണ്. ചിലപ്പോൾ ഇത് പ്രവർത്തിക്കുന്നു, പക്ഷേ മിക്കപ്പോഴും ഇത് എല്ലാത്തരം ഡാറ്റാ വികലങ്ങളിലേക്കും നയിക്കുന്നു - ഉദാഹരണത്തിന്, നമ്പറുകൾക്ക് തീയതികളായി മാറാം അല്ലെങ്കിൽ വാചകമായി തുടരാം, കാരണം നമ്മുടെ കാര്യത്തിലെന്നപോലെ. PDF നോൺ-സെപ്പറേറ്ററുകൾ ഉപയോഗിക്കുന്നു:
അതിനാൽ നമുക്ക് കോണുകൾ മുറിക്കരുത്, പക്ഷേ എല്ലാം കുറച്ചുകൂടി സങ്കീർണ്ണമാക്കുക, പക്ഷേ ശരിയാണ്.
ഘട്ടം 2: ഡോക്യുമെന്റ് ഒരു വെബ് പേജായി സംരക്ഷിക്കുക
സ്വീകരിച്ച ഡാറ്റ Excel-ലേക്ക് (പവർ ക്വറി വഴി) ലോഡ് ചെയ്യുന്നതിന്, Word-ലെ ഞങ്ങളുടെ ഡോക്യുമെന്റ് വെബ് പേജ് ഫോർമാറ്റിൽ സംരക്ഷിക്കേണ്ടതുണ്ട് - ഈ ഫോർമാറ്റ്, ഈ സാഹചര്യത്തിൽ, Word-നും Excel-നും ഇടയിലുള്ള ഒരുതരം പൊതു വിഭാഗമാണ്.
ഇത് ചെയ്യുന്നതിന്, മെനുവിലേക്ക് പോകുക ഫയൽ - ഇതായി സംരക്ഷിക്കുക (ഫയൽ - ഇതായി സംരക്ഷിക്കുക) അല്ലെങ്കിൽ കീ അമർത്തുക F12 കീബോർഡിലും തുറക്കുന്ന വിൻഡോയിലും ഫയൽ തരം തിരഞ്ഞെടുക്കുക ഒരു ഫയലിൽ വെബ് പേജ് (വെബ്പേജ് — ഒറ്റ ഫയൽ):
സംരക്ഷിച്ചതിന് ശേഷം, നിങ്ങൾക്ക് mhtml എക്സ്റ്റൻഷനുള്ള ഒരു ഫയൽ ലഭിക്കും (എക്സ്പ്ലോററിൽ ഫയൽ എക്സ്റ്റൻഷനുകൾ കാണുകയാണെങ്കിൽ).
ഘട്ടം 3. പവർ ക്വറി വഴി Excel-ലേക്ക് ഫയൽ അപ്ലോഡ് ചെയ്യുന്നു
നിങ്ങൾക്ക് Excel-ൽ സൃഷ്ടിച്ച MHTML ഫയൽ നേരിട്ട് തുറക്കാൻ കഴിയും, എന്നാൽ ആദ്യം, ഞങ്ങൾക്ക് PDF- ന്റെ എല്ലാ ഉള്ളടക്കങ്ങളും ടെക്സ്റ്റും ഒരു കൂട്ടം അനാവശ്യ പട്ടികകളും ഒരുമിച്ച് ലഭിക്കും, രണ്ടാമതായി, തെറ്റായതിനാൽ ഞങ്ങൾക്ക് വീണ്ടും ഡാറ്റ നഷ്ടപ്പെടും. സെപ്പറേറ്ററുകൾ. അതിനാൽ, പവർ ക്വറി ആഡ്-ഇൻ വഴി ഞങ്ങൾ Excel-ലേക്ക് ഇറക്കുമതി ചെയ്യും. ഇത് തികച്ചും സൗജന്യമായ ഒരു ആഡ്-ഓൺ ആണ്, ഇതുപയോഗിച്ച് നിങ്ങൾക്ക് ഏത് ഉറവിടത്തിൽ നിന്നും (ഫയലുകൾ, ഫോൾഡറുകൾ, ഡാറ്റാബേസുകൾ, ഇആർപി സിസ്റ്റങ്ങൾ) Excel-ലേക്ക് ഡാറ്റ അപ്ലോഡ് ചെയ്യാം, തുടർന്ന് സ്വീകരിച്ച ഡാറ്റയെ സാധ്യമായ എല്ലാ രീതിയിലും പരിവർത്തനം ചെയ്ത് ആവശ്യമുള്ള രൂപം നൽകുന്നു.
നിങ്ങൾക്ക് Excel 2010-2013 ഉണ്ടെങ്കിൽ, നിങ്ങൾക്ക് ഔദ്യോഗിക Microsoft വെബ്സൈറ്റിൽ നിന്ന് Power Query ഡൗൺലോഡ് ചെയ്യാം - ഇൻസ്റ്റാളേഷന് ശേഷം നിങ്ങൾ ഒരു ടാബ് കാണും. പവർ അന്വേഷണം. നിങ്ങൾക്ക് Excel 2016 അല്ലെങ്കിൽ പുതിയത് ഉണ്ടെങ്കിൽ, നിങ്ങൾ ഒന്നും ഡൗൺലോഡ് ചെയ്യേണ്ടതില്ല - എല്ലാ പ്രവർത്തനങ്ങളും ഇതിനകം തന്നെ Excel-ൽ ഡിഫോൾട്ടായി നിർമ്മിക്കുകയും ടാബിൽ സ്ഥിതിചെയ്യുകയും ചെയ്യുന്നു. ഡാറ്റ (തീയതി) കൂട്ടത്തിൽ ഡൗൺലോഡ് ചെയ്ത് പരിവർത്തനം ചെയ്യുക (നേടുകയും രൂപാന്തരപ്പെടുത്തുകയും ചെയ്യുക).
അതിനാൽ ഞങ്ങൾ ഒന്നുകിൽ ടാബിലേക്ക് പോകുന്നു ഡാറ്റ, അല്ലെങ്കിൽ ടാബിൽ പവർ അന്വേഷണം ഒപ്പം ഒരു ടീമിനെ തെരഞ്ഞെടുക്കുക ഡാറ്റ ലഭിക്കാൻ or ചോദ്യം സൃഷ്ടിക്കുക - ഫയലിൽ നിന്ന് - XML-ൽ നിന്ന്. XML ഫയലുകൾ മാത്രമല്ല ദൃശ്യമാക്കാൻ, വിൻഡോയുടെ താഴെ വലത് കോണിലുള്ള ഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റിലെ ഫിൽട്ടറുകൾ മാറ്റുക എല്ലാ ഫയലുകളും (എല്ലാ ഫയലുകളും) കൂടാതെ ഞങ്ങളുടെ MHTML ഫയൽ വ്യക്തമാക്കുക:
ഇറക്കുമതി വിജയകരമായി പൂർത്തിയാകില്ല, കാരണം. പവർ ക്വറി ഞങ്ങളിൽ നിന്ന് XML പ്രതീക്ഷിക്കുന്നു, എന്നാൽ യഥാർത്ഥത്തിൽ ഞങ്ങൾക്ക് ഒരു HTML ഫോർമാറ്റ് ഉണ്ട്. അതിനാൽ, ദൃശ്യമാകുന്ന അടുത്ത വിൻഡോയിൽ, പവർ ക്വറിക്ക് മനസ്സിലാക്കാൻ കഴിയാത്ത ഫയലിൽ നിങ്ങൾ വലത്-ക്ലിക്കുചെയ്ത് അതിന്റെ ഫോർമാറ്റ് വ്യക്തമാക്കേണ്ടതുണ്ട്:
അതിനുശേഷം, ഫയൽ ശരിയായി തിരിച്ചറിയുകയും അതിൽ അടങ്ങിയിരിക്കുന്ന എല്ലാ പട്ടികകളുടെയും ഒരു ലിസ്റ്റ് ഞങ്ങൾ കാണുകയും ചെയ്യും:
ഡാറ്റ കോളത്തിലെ സെല്ലുകളുടെ വെളുത്ത പശ്ചാത്തലത്തിലുള്ള (ടേബിൾ എന്ന പദത്തിലല്ല!) ഇടത് മൌസ് ബട്ടണിൽ ക്ലിക്കുചെയ്തുകൊണ്ട് നിങ്ങൾക്ക് പട്ടികകളിലെ ഉള്ളടക്കങ്ങൾ കാണാൻ കഴിയും.
ആവശ്യമുള്ള പട്ടിക നിർവചിക്കുമ്പോൾ, പച്ച പദത്തിൽ ക്ലിക്കുചെയ്യുക മേശ - നിങ്ങൾ അതിന്റെ ഉള്ളടക്കങ്ങളിലേക്ക് "വീഴുന്നു":
അതിന്റെ ഉള്ളടക്കങ്ങൾ "ചീപ്പ്" ചെയ്യുന്നതിന് കുറച്ച് ലളിതമായ ഘട്ടങ്ങൾ ചെയ്യേണ്ടതുണ്ട്, അതായത്:
- അനാവശ്യ കോളങ്ങൾ ഇല്ലാതാക്കുക (കോളത്തിന്റെ തലക്കെട്ടിൽ വലത് ക്ലിക്ക് ചെയ്യുക - നീക്കംചെയ്യുക)
- ഡോട്ടുകൾ കോമ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുക (നിരകൾ തിരഞ്ഞെടുക്കുക, വലത് ക്ലിക്ക് ചെയ്യുക - മൂല്യങ്ങൾ മാറ്റിസ്ഥാപിക്കുന്നു)
- തലക്കെട്ടിലെ തുല്യ ചിഹ്നങ്ങൾ നീക്കം ചെയ്യുക (നിരകൾ തിരഞ്ഞെടുക്കുക, വലത് ക്ലിക്ക് ചെയ്യുക - മൂല്യങ്ങൾ മാറ്റിസ്ഥാപിക്കുന്നു)
- മുകളിലെ വരി നീക്കം ചെയ്യുക (വീട് - വരികൾ ഇല്ലാതാക്കുക - മുകളിലെ വരികൾ ഇല്ലാതാക്കുക)
- ശൂന്യമായ വരികൾ നീക്കം ചെയ്യുക (ഹോം - വരികൾ ഇല്ലാതാക്കുക - ശൂന്യമായ വരികൾ ഇല്ലാതാക്കുക)
- ആദ്യ വരി പട്ടിക തലക്കെട്ടിലേക്ക് ഉയർത്തുക (വീട് - തലക്കെട്ടുകളായി ആദ്യ വരി ഉപയോഗിക്കുക)
- ഒരു ഫിൽട്ടർ ഉപയോഗിച്ച് അനാവശ്യ ഡാറ്റ ഫിൽട്ടർ ചെയ്യുക
പട്ടിക അതിന്റെ സാധാരണ രൂപത്തിലേക്ക് കൊണ്ടുവരുമ്പോൾ, അത് കമാൻഡ് ഉപയോഗിച്ച് ഷീറ്റിലേക്ക് അൺലോഡ് ചെയ്യാൻ കഴിയും അടച്ച് ഡൗൺലോഡ് ചെയ്യുക (അടച്ച് ലോഡുചെയ്യുക) on പ്രധാനപ്പെട്ട ടാബ്. നമുക്ക് ഇതിനകം പ്രവർത്തിക്കാൻ കഴിയുന്ന അത്തരം സൗന്ദര്യം നമുക്ക് ലഭിക്കും:
- പവർ ക്വറി ഉപയോഗിച്ച് കോളം ഒരു ടേബിളിലേക്ക് മാറ്റുന്നു
- സ്റ്റിക്കി ടെക്സ്റ്റ് കോളങ്ങളായി വിഭജിക്കുന്നു