Разделить большой файл Excel на несколько частей в зависимости от количества строк

У меня есть консольное приложение С#, которому требуется разделить большой Excel на несколько файлов Excel на основе количества строк. В приведенном ниже коде показан исходный файл только с 51 строкой (включая строки столбца заголовка), но окончательный исходный файл будет содержать более 100 000 строк.

Код пытается пропустить самую первую строку (заголовок), а затем должен копировать строки со 2 по 11 и т. д. У меня в целевых файлах установлено только 10 строк в файле, чтобы ускорить разработку.

Вопрос Итак, как мне скопировать строки со 2 по 11 и последующие 10 строк из исходного файла Excel и вставить в несколько целевых файлов Excel, чтобы в каждом из целевых файлов было по 10 строк? ?

Вот почти недавно написанный код. Он основан на копировании определенного диапазона ячеек Excel с одного листа на другой лист и https://social.msdn.microsoft.com/Forums/vstudio/en-US/afd01976-63d0-4f96-9ba4-e3e2b6cf8d55/excel-with-c-how-to-specify-a-range-?forum=vsto

Теперь я могу написать 5 файлов Excel. Но в первом файле 9 строк (начиная со строки 2), в то время как во втором файле всего 3 строки, начиная с строки 10, в третьем файле 13 строк, начиная, опять же, с строки 10; последние два файла содержат все больше строк, начиная с строки 10.

Значит, что-то не так с моим For Loop? Или как я выбираю ranges?

     string startPath = System.IO.Path.GetDirectoryName(System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName);
            string filePath_source = Path.Combine(startPath, @"Source_Files\Offers_Source_Temp.xlsx");
            string filePath_copiedinto = Path.Combine(startPath, @"Source_Files\ToBeCopiedInto.xlsx");
           app = new Excel.Application();
           app.DisplayAlerts = false;
           book = app.Workbooks.Open(filePath_source);
            sheet = (Excel.Worksheet)book.Worksheets.get_Item((1));              
            int iRowCount = sheet.UsedRange.Rows.Count;
            int maxrows = 10;//change this to something like 50,000 later.  01/16/18
            int maxloops = iRowCount / maxrows;
            int beginrow = 2; //skipping the header row.
            Excel.Application destxlApp;
            Excel.Workbook destworkBook;
            Excel.Worksheet destworkSheet;
            Excel.Range destrange;
            string srcPath;
            string destPath;
            //Opening of first worksheet and copying
            srcPath = filePath_source;
            for (int i = 1; i <= maxloops; i++)   {
                Excel.Range rng = (Excel.Range)sheet.Range[sheet.Cells[beginrow, 1], sheet.Cells[maxrows, 3]];
                rng.Copy(Type.Missing);
                //opening of the second worksheet and pasting
                destPath = filePath_copiedinto; 
                destxlApp = new Excel.Application();
                destxlApp.DisplayAlerts = false;
                destworkBook = destxlApp.Workbooks.Open(destPath, 0, false);
                destworkSheet = destworkBook.Worksheets.get_Item(1);
                destrange = destworkSheet.Cells[1, 1];
                destrange.Select();
                destworkSheet.Paste(Type.Missing, Type.Missing);                   
                destworkBook.SaveAs(startPath + "\\Output_Files\\" + beginrow + ".xlsx");                    
                destworkBook.Close(true, null, null);
                destxlApp.Quit();
                beginrow = beginrow + maxrows;
                string blah = null;

            }

person IrfanClemson    schedule 17.01.2018    source источник
comment
В чем проблема?   -  person Syntax Error    schedule 17.01.2018
comment
Я не знаю, как скопировать строки со 2 по 11 и т. д., а затем вставить в новые целевые файлы.   -  person IrfanClemson    schedule 17.01.2018
comment
Обновлен вопрос, чтобы попытаться четко спросить, что нужно. Спасибо.   -  person IrfanClemson    schedule 17.01.2018
comment
У меня есть целевые файлы, содержащие только 10 строк в файле, чтобы ускорить разработку Что вы пытаетесь сделать после разделения большого файла на несколько. И я не думаю, что чтение большого файла и преобразование его в 5 разных файлов ускорит разработку.   -  person Kavin    schedule 17.01.2018
comment
Мой исходный файл Excel слишком велик для передачи в другой процесс, поэтому мне нужно разделить его на несколько частей. В настоящее время делаю это вручную, но это не долгосрочное решение. Спасибо.   -  person IrfanClemson    schedule 17.01.2018
comment
Итак, вы хотите, чтобы консольное приложение использовалось только для разделения большого файла на несколько. Если это так, то это имеет смысл. Спасибо   -  person Kavin    schedule 17.01.2018


Ответы (2)


Понятно! В моем исправленном коде в Вопросе я был близок, но у меня возникла проблема в For Loop; исправлено в соответствии с приведенным ниже кодом. Итак, вот почти полный код. Спасибо всем за вашу помощь!!

  try
        {               
            string startPath = System.IO.Path.GetDirectoryName(System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName);
            string filePath_source = Path.Combine(startPath, @"Source_Files\Offers_Source_Temp.xlsx");
            string filePath_copiedinto = Path.Combine(startPath, @"Source_Files\ToBeCopiedInto.xlsx");
           app = new Excel.Application();
           app.DisplayAlerts = false;
           book = app.Workbooks.Open(filePath_source);
            sheet = (Excel.Worksheet)book.Worksheets.get_Item((1));              
            int iRowCount = sheet.UsedRange.Rows.Count;              
            int countColumns = sheet.UsedRange.Columns.Count;
            int maxrows = 10;//change this to something like 50,000 later.  01/16/18
            int maxloops = iRowCount / maxrows;
            int beginrow = 2; //skipping the header row.
            Excel.Application destxlApp;
            Excel.Workbook destworkBook;
            Excel.Worksheet destworkSheet;
            Excel.Range destrange;
            string srcPath;
            string destPath;
            //Opening of first worksheet and copying
            srcPath = filePath_source;
            for (int i = 1; i <= maxloops; i++)   {
                ///  Excel.Range rng = (Excel.Range)sheet.Range[sheet.Cells[beginrow, 1], sheet.Cells[maxrows, 3]];
                Excel.Range startCell = sheet.Cells[beginrow, 1];//not sure the second parameter needed?
                Excel.Range endCell = sheet.Cells[beginrow+maxrows-1, 3];//not sure the second parameter needed?
                Excel.Range rng = sheet.Range[startCell, endCell];
                rng = rng.EntireRow;//so second parameters above should not be needed. But doesn't work without it!
                rng.Copy(Type.Missing);
                //opening of the second worksheet and pasting
                destPath = filePath_copiedinto; 
                destxlApp = new Excel.Application();
                destxlApp.DisplayAlerts = false;
                destworkBook = destxlApp.Workbooks.Open(destPath, 0, false);
                destworkSheet = destworkBook.Worksheets.get_Item(1);
                destrange = destworkSheet.Cells[1, 1];
                destrange.Select();
                destworkSheet.Paste(Type.Missing, Type.Missing);                   
                destworkBook.SaveAs(startPath + "\\Output_Files\\" + beginrow + ".xlsx");                    
                destworkBook.Close(true, null, null);
                destxlApp.Quit();
                beginrow = beginrow + maxrows;


            }//for loop
}
person IrfanClemson    schedule 17.01.2018
comment
Большое спасибо за то, что поделились этим кодом. Мне очень помогло :) - person Karthic Srinivasan; 05.12.2019

Я бы предложил использовать библиотеку OpenXml для выполнения этой задачи. Он свободен от зависимостей и поддерживает всю структуру OpenXml. Вот отправная точка, как читать/писать строки:

using System;
using System.Linq;
using DocumentFormat.OpenXml;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Spreadsheet;

// Open the document for editing.
using (SpreadsheetDocument spreadsheetDocument = SpreadsheetDocument.Open(fileName, false))
{
    WorkbookPart workbookPart = spreadsheetDocument.WorkbookPart;
    WorksheetPart worksheetPart = workbookPart.WorksheetParts.First();
    SheetData sheetData = worksheetPart.Worksheet.Elements<SheetData>().First();

    foreach (Row r in sheetData.Elements<Row>())
    {

    }
}

Теперь запись очень похожа:

using (SpreadsheetDocument spreadSheet = SpreadsheetDocument.Create(fileName),
    SpreadsheetDocumentType.Workbook))
{
    // create the workbook
    spreadSheet.AddWorkbookPart();
    spreadSheet.WorkbookPart.Workbook = new Workbook ();     // create the worksheet
    spreadSheet.WorkbookPart.AddNewPart<WorksheetPart>();
    spreadSheet.WorkbookPart.WorksheetParts.First().Worksheet = new Worksheet();

    // create sheet data
    spreadSheet.WorkbookPart.WorksheetParts.First().Worksheet.AppendChild(new SheetData());
    // create row
    spreadSheet.WorkbookPart.WorksheetParts.First().Worksheet.First().AppendChild(new Row());
}
person CodeTherapist    schedule 17.01.2018
comment
Спасибо. Я думаю, что я достаточно близок, и это приложение будет для меня одного на моем рабочем столе, где уже установлен Excel. Итак, если я могу понять копирование/вставку строк, начиная с номеров строк и заканчивая номерами строк, тогда я должен быть хорошим. - person IrfanClemson; 17.01.2018
comment
Пожалуйста, посмотрите репост кода; Я думаю, что я ближе. Спасибо. - person IrfanClemson; 17.01.2018