[HADOOP-14457] create() does not notify metadataStore of parent directories or ensure they're not existing files - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Sub-task
Status: Resolved
Priority: Major
Resolution: Fixed
Affects Version/s: None
Fix Version/s: HADOOP-13345
Component/s: fs/s3
Labels:
None

Description

Not a great test yet, but it at least reliably demonstrates the issue. LocalMetadataStore will sometimes erroneously report that a directory is empty with isAuthoritative = true when it definitely has children the metadatastore should know about. It doesn't appear to happen if the children are just directory. The fact that it's returning an empty listing is concerning, but the fact that it says it's authoritative might be a second bug.

diff --git a/hadoop-tools/hadoop-aws/src/main/java/org/apache/hadoop/fs/s3a/S3AFileSystem.java b/hadoop-tools/hadoop-aws/src/main/java/org/apache/hadoop/fs/s3a/S3AFileSystem.java
index 78b3970..1821d19 100644
--- a/hadoop-tools/hadoop-aws/src/main/java/org/apache/hadoop/fs/s3a/S3AFileSystem.java
+++ b/hadoop-tools/hadoop-aws/src/main/java/org/apache/hadoop/fs/s3a/S3AFileSystem.java
@@ -965,7 +965,7 @@ public boolean hasMetadataStore() {
   }
 
   @VisibleForTesting
-  MetadataStore getMetadataStore() {
+  public MetadataStore getMetadataStore() {
     return metadataStore;
   }
 
diff --git a/hadoop-tools/hadoop-aws/src/test/java/org/apache/hadoop/fs/contract/s3a/ITestS3AContractRename.java b/hadoop-tools/hadoop-aws/src/test/java/org/apache/hadoop/fs/contract/s3a/ITestS3AContractRename.java
index 4339649..881bdc9 100644
--- a/hadoop-tools/hadoop-aws/src/test/java/org/apache/hadoop/fs/contract/s3a/ITestS3AContractRename.java
+++ b/hadoop-tools/hadoop-aws/src/test/java/org/apache/hadoop/fs/contract/s3a/ITestS3AContractRename.java
@@ -23,6 +23,11 @@
 import org.apache.hadoop.fs.contract.AbstractFSContract;
 import org.apache.hadoop.fs.FileSystem;
 import org.apache.hadoop.fs.Path;
+import org.apache.hadoop.fs.s3a.S3AFileSystem;
+import org.apache.hadoop.fs.s3a.Tristate;
+import org.apache.hadoop.fs.s3a.s3guard.DirListingMetadata;
+import org.apache.hadoop.fs.s3a.s3guard.MetadataStore;
+import org.junit.Test;
 
 import static org.apache.hadoop.fs.contract.ContractTestUtils.dataset;
 import static org.apache.hadoop.fs.contract.ContractTestUtils.writeDataset;
@@ -72,4 +77,24 @@ public void testRenameDirIntoExistingDir() throws Throwable {
     boolean rename = fs.rename(srcDir, destDir);
     assertFalse("s3a doesn't support rename to non-empty directory", rename);
   }
+
+  @Test
+  public void testMkdirPopulatesFileAncestors() throws Exception {
+    final FileSystem fs = getFileSystem();
+    final MetadataStore ms = ((S3AFileSystem) fs).getMetadataStore();
+    final Path parent = path("testMkdirPopulatesFileAncestors/source");
+    try {
+      fs.mkdirs(parent);
+      final Path nestedFile = new Path(parent, "dir1/dir2/dir3/file4");
+      byte[] srcDataset = dataset(256, 'a', 'z');
+      writeDataset(fs, nestedFile, srcDataset, srcDataset.length,
+          1024, false);
+
+      DirListingMetadata list = ms.listChildren(parent);
+      assertTrue("MetadataStore falsely reports authoritative empty list",
+          list.isEmpty() == Tristate.FALSE || !list.isAuthoritative());
+    } finally {
+      fs.delete(parent, true);
+    }
+  }
 }

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

HADOOP-14457-HADOOP-13345.001.patch
26/May/17 01:01
7 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.002.patch
01/Jun/17 17:37
11 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.003.patch
03/Jun/17 13:48
16 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.004.patch
06/Jun/17 14:32
16 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.005.patch
06/Jun/17 22:26
16 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.006.patch
08/Jun/17 15:21
9 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.007.patch
08/Jun/17 22:41
9 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.008.patch
09/Jun/17 13:54
9 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.009.patch
09/Jun/17 14:30
9 kB
Sean Mackrory
HADOOP-14457-HADOOP-13345.010.patch
07/Jul/17 02:08
13 kB
Sean Mackrory

Issue Links

is depended upon by

HADOOP-13998 Merge initial S3guard release into trunk

Resolved

is duplicated by

HADOOP-14484 Ensure deleted parent directory tombstones are overwritten when implicitly recreated

Resolved

is related to

HADOOP-14630 Contract Tests to verify create, mkdirs and rename under a file is forbidden

Resolved

Activity

People

Assignee:: Sean Mackrory

Reporter:: Sean Mackrory

Votes:: 0 Vote for this issue

Watchers:: 5 Start watching this issue

Dates

Created:: 25/May/17 16:03

Updated:: 11/Jul/17 13:32

Resolved:: 11/Jul/17 13:32