Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Вазифаи интиқоли маълумот аз ҷадвали электронӣ дар файли PDF ба варақаи Microsoft Excel ҳамеша "шавқовар" аст. Хусусан, агар шумо нармафзори гаронбаҳои шинохти монанди FineReader ё чизе ба ин монанд надошта бошед. Нусхабардории мустақим одатан ба ягон чизи хуб оварда намерасонад, зеро. пас аз гузоштани маълумоти нусхабардорӣ ба варақ, онҳо эҳтимолан дар як сутун "якҷо мечаспад". Пас, онҳо бояд бо истифода аз асбоб бо душворӣ ҷудо карда шаванд Матн аз рӯи сутунҳо аз ҷадвал Маълумот (Маълумот - Матн ба сутунҳо).

Ва албатта, нусхабардорӣ танҳо барои он файлҳои PDF имконпазир аст, ки дар он қабати матн мавҷуд аст, яъне бо ҳуҷҷате, ки тоза аз коғаз ба PDF скан шудааст, ин аслан кор намекунад.

Аммо он қадар ғамгин нест, дар ҳақиқат 🙂

Агар шумо Office 2013 ё 2016 дошта бошед, пас дар тӯли якчанд дақиқа бидуни барномаҳои иловагӣ, интиқоли маълумотро аз PDF ба Microsoft Excel комилан имконпазир аст. Ва Word ва Power Query дар ин кор ба мо кӯмак мекунад.

Масалан, биёед ин гузориши PDF-ро бо як қатор матн, формулаҳо ва ҷадвалҳо аз вебсайти Комиссияи иқтисодии Аврупо гирем:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

... ва кӯшиш кунед, ки онро дар Excel берун кунед, ҷадвали аввалро бигӯед:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Рафтем!

Қадами 1. PDF-ро дар Word кушоед

Бо баъзе сабабҳо, кам одамон медонанд, аммо аз соли 2013 Microsoft Word кушодан ва шинохтани файлҳои PDF-ро ёд гирифт (ҳатто файлҳои сканшуда, яъне бидуни қабати матн!). Ин ба таври комилан стандартӣ анҷом дода мешавад: Word-ро кушоед, клик кунед Файл - Кушодан (Файл — Кушода) ва формати PDF-ро дар рӯйхати афтанда дар кунҷи рости поёни равзана муайян кунед.

Пас файли PDF-ро, ки ба мо лозим аст, интихоб кунед ва клик кунед кушодан (Кушодан). Word ба мо мегӯяд, ки он OCR-ро дар ин ҳуҷҷат барои матн кор мекунад:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Мо розӣ ҳастем ва пас аз чанд сония мо мебинем, ки PDF-и мо аллакай дар Word барои таҳрир кушода мешавад:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Албатта, тарроҳӣ, услубҳо, шрифтҳо, сарлавҳаҳо ва поёнтарҳо ва ғайра қисман аз ҳуҷҷат хориҷ мешаванд, аммо ин барои мо муҳим нест - ба мо танҳо маълумот аз ҷадвалҳо лозим аст. Аслан, дар ин марҳила, аллакай васваса аст, ки ҷадвалро аз ҳуҷҷати эътирофшуда ба Word нусхабардорӣ кунед ва онро ба Excel часпонед. Баъзан он кор мекунад, аммо аксар вақт он ба ҳама гуна таҳрифҳои маълумот оварда мерасонад - масалан, рақамҳо метавонанд ба сана табдил ё матн боқӣ монанд, зеро дар ҳолати мо. PDF ҷудокунандаҳои ғайридавлатиро истифода мебарад:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Пас биёед гӯшаҳои бурида нашавем, балки ҳама чизро каме мураккабтар созем, аммо дуруст.

Қадами 2: Ҳуҷҷатро ҳамчун веб саҳифа захира кунед

Барои он ки маълумоти гирифташуда ба Excel (тавассути Power Query) бор карда шавад, ҳуҷҷати мо дар Word бояд дар формати веб саҳифа захира карда шавад - ин формат дар ин ҳолат як навъ махраҷи умумӣ байни Word ва Excel мебошад.

Барои ин, ба меню гузаред Файл - Ҳамчун захира кунед (Файл - Ҳамчун захира кунед) ё тугмаро пахш кунед F12 дар клавиатура ва дар равзанаи кушодашуда навъи файлро интихоб кунед Саҳифаи веб дар як файл (Саҳифаи веб — файли ягона):

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Пас аз захиракунӣ, шумо бояд файлеро бо тамдиди mhtml гиред (агар шумо васеъшавии файлро дар Explorer бинед).

Марҳилаи 3. Боркунии файл ба Excel тавассути Power Query

Шумо метавонед файли MHTML-и эҷодшударо дар Excel мустақиман кушоед, аммо он гоҳ мо, аввалан, ҳама мундариҷаи PDF-ро дар якҷоягӣ бо матн ва як қатор ҷадвалҳои нолозим ба даст меорем ва дуюм, мо аз сабаби нодуруст маълумотро аз даст медиҳем. ҷудокунандаҳо. Аз ин рӯ, мо воридотро ба Excel тавассути замимаи Power Query анҷом медиҳем. Ин як замимаи комилан ройгон аст, ки бо он шумо метавонед маълумотро ба Excel аз қариб ҳама сарчашмаҳо (файлҳо, ҷузвдонҳо, пойгоҳи додаҳо, системаҳои ERP) бор кунед ва сипас маълумоти гирифташударо бо ҳар роҳ табдил дода, ба он шакли дилхоҳро диҳед.

Агар шумо Excel 2010-2013 дошта бошед, пас шумо метавонед Power Query -ро аз вебсайти расмии Microsoft зеркашӣ кунед - пас аз насб шумо ҷадвалро хоҳед дид Дархости барқ. Агар шумо Excel 2016 ё навтар дошта бошед, пас ба шумо лозим нест, ки чизе зеркашӣ кунед - ҳама функсияҳо аллакай дар Excel ба таври нобаёнӣ сохта шудаанд ва дар ҷадвал ҷойгиранд Маълумот (Сана) дар гурух Зеркашӣ ва табдил (Гардан ва табдил додан).

Ҳамин тавр, мо ба ҷадвал меравем Маълумот, ё дар ҷадвал Дархости барқ ва як даста интихоб кунед Барои гирифтани маълумот or Эҷоди дархост - Аз файл - Аз XML. Барои намоён кардани на танҳо файлҳои XML, филтрҳоро дар рӯйхати афтанда дар кунҷи рости поёни равзана тағир диҳед. Ҳама файлҳо (Ҳама файлҳо) ва файли MHTML-и моро муайян кунед:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Лутфан қайд кунед, ки воридот бомуваффақият анҷом нахоҳад шуд, зеро. Power Query аз мо XML-ро интизор аст, аммо мо дар асл формати HTML дорем. Аз ин рӯ, дар равзанаи оянда, ки пайдо мешавад, ба шумо лозим меояд, ки файли ба Power Query нофаҳмо бо тугмаи рости муш клик кунед ва формати онро муайян кунед:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Пас аз он, файл дуруст эътироф карда мешавад ва мо рӯйхати ҳамаи ҷадвалҳои онро мебинем:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Шумо метавонед мундариҷаи ҷадвалҳоро тавассути пахш кардани тугмаи чапи муш дар заминаи сафед (на дар калимаи Ҷадвали!) чашмакҳои сутуни Маълумот дидан мумкин аст.

Вақте ки ҷадвали дилхоҳ муайян карда мешавад, калимаи сабзро клик кунед Љадвали - ва шумо ба мундариҷаи он "афтед":

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

Барои "шона" кардани мундариҷаи он чанд қадами оддиро иҷро кардан боқӣ мемонад, аз ҷумла:

  1. сутунҳои нолозимро нест кунед (бо тугмаи рости сарлавҳаи сутун пахш кунед - хориҷ)
  2. нуқтаҳоро бо вергул иваз кунед (сутунҳоро интихоб кунед, тугмаи ростро клик кунед - Иваз кардани арзишҳо)
  3. аломатҳои баробарро дар сарлавҳа хориҷ кунед (сутунҳоро интихоб кунед, тугмаи ростро клик кунед - Иваз кардани арзишҳо)
  4. хати болоро хориҷ кунед (хона – Нест кардани сатрҳо – Тоза кардани сатрҳои боло)
  5. хатҳои холӣ хориҷ кунед (Асосӣ - Нест кардани сатрҳо - Тоза кардани сатрҳои холӣ)
  6. сатри аввалро ба сарлавҳаи ҷадвал боло кунед (Хона - Сатри аввалро ҳамчун сарлавҳа истифода баред)
  7. бо истифода аз филтр маълумоти нолозимро филтр кунед

Вақте ки ҷадвал ба шакли муқаррарии худ оварда мешавад, онро бо фармон ба варақ холӣ кардан мумкин аст пӯшед ва зеркашӣ кунед (Пӯшидан ва бор кардан) on Асосӣ ҷадвал. Ва мо чунин зебоиро ба даст меорем, ки бо он аллакай кор карда метавонем:

Маълумотро аз PDF ба Excel тавассути Power Query ворид кунед

  • Табдил додани сутун ба ҷадвал бо дархости барқ
  • Тақсим кардани матни часпанда ба сутунҳо

Дин ва мазҳаб